본문으로 건너뛰기
← 모든 글

ChatGPT에게 '30대 여성처럼 평가해줘'가 위험한 이유

3분 읽기읽힘 팀

글을 발행하기 전에 "이 글이 어떻게 읽힐까"를 확인하고 싶을 때, 요즘 많은 사람들이 ChatGPT에게 이렇게 묻습니다. "30대 여성 독자 입장에서 이 글을 평가해줘." 빠르고 그럴듯한 답이 돌아옵니다. 그런데 이 방법에는 구조적인 함정이 하나 있습니다.

범용 LLM은 '한 명의 평균'을 상상한다

ChatGPT에게 "30대 여성처럼 평가해줘"라고 하면, 모델은 학습 데이터 속 '30대 여성'이라는 라벨의 평균적 이미지를 한 명 떠올려 연기합니다. 문제는 현실의 30대 여성이 한 명이 아니라는 데 있습니다.

같은 연령과 성별 안에서도 직업, 사는 지역, 교육 수준, 관심사, 가처분 시간은 제각각입니다. 서울에서 일하는 마케터와 지방 소도시의 자영업자, 육아 중인 전업주부와 대학원생은 같은 글을 전혀 다르게 읽습니다. 어떤 사람은 첫 문단에서 이탈하고, 어떤 사람은 끝까지 읽고 공유합니다.

범용 LLM의 답은 이 모든 사람을 하나로 뭉갠 '평균값'입니다. 평균은 편리하지만, 콘텐츠가 실제로 어떻게 퍼지는지를 가립니다.

콘텐츠의 성패는 분포의 꼬리에서 갈린다

도달과 확산은 평균적인 반응이 아니라 양 끝, 즉 분포의 꼬리에서 결정되는 경우가 많습니다.

  • 강하게 반응한 소수가 콘텐츠를 공유하면서 도달이 폭발합니다.
  • 특정 집단이 첫 문장에서 대거 이탈하면, 평균 점수가 괜찮아 보여도 실제 도달은 무너집니다.

"평균적으로 나쁘지 않다"는 신호는 이 두 가지 위험을 모두 놓칩니다. 발행 전에 정말 알아야 할 것은 "누가 강하게 반응하고, 누가 조용히 떠나는가"입니다. 그건 한 명의 평균 평가자에게서는 절대 나오지 않습니다.

평균은 안전해 보이는 착시를 줍니다. 정작 콘텐츠를 살리거나 죽이는 건 평균에서 멀리 떨어진 소수입니다.

평균이 아니라 분포를 보는 법

해법은 단순합니다. 한 명의 가상 평가자가 아니라, 실제 인구 구성을 닮은 다수를 만들어 각자 읽게 하는 것입니다.

읽힘은 통계청 KOSIS 인구 분포를 따라 합성 페르소나 여러 명(N명)을 추출합니다. 같은 30대 여성이라도 직업과 지역, 관심사가 분포대로 흩어진 사람들입니다. 이들이 각자의 관점에서 원고를 읽고 완독/이탈, 점수, 코멘트를 돌려줍니다. 결과는 하나의 숫자가 아니라 반응의 분포입니다.

이 데이터는 NVIDIA의 Nemotron-Personas-Korea 데이터셋(CC BY 4.0)과 통계청 KOSIS 분포를 기반으로 구성됩니다. "상상한 한 명"이 아니라 "통계로 뒷받침된 다수"라는 점이 범용 LLM과의 결정적 차이입니다.

언제 이 방법이 필요한가

모든 글에 분포 분석이 필요한 건 아닙니다. 다만 다음과 같은 상황이라면 평균 한 명의 의견은 위험합니다.

  1. 타깃이 넓은 콘텐츠 — 매거진 기사, 브랜드 캠페인처럼 다양한 독자에게 닿아야 할 때.
  2. 이탈이 치명적인 콘텐츠 — 첫 문단의 이탈률이 전환을 좌우하는 랜딩 카피, 뉴스레터.
  3. 발행 후 수정이 어려운 콘텐츠 — 인쇄물, 보도자료처럼 한 번 나가면 되돌리기 힘든 글.

이런 글일수록 "평균적으로 괜찮다"가 아니라 "누구에게 어떻게 읽히는가"를 발행 전에 확인하는 것이 안전합니다.


요약하면, ChatGPT에게 특정 독자를 연기시키는 방법은 빠르지만 평균 한 명으로 수렴합니다. 콘텐츠의 도달은 분포의 꼬리에서 갈리므로, 발행 전 검증은 통계 분포를 닮은 다수의 반응을 보는 방향이어야 합니다.