들어가며: LLM은 정말 답변하고 싶은 ‘의지’가 있을까?
LLM(대규모 언어 모델)이 우리의 질문에 열정적으로 답변할 때, 과연 그 모델은 “꼭 이 답을 해내고 싶다"는 의지나 열정을 가지고 있을까? 그리고 만약 진짜 열정이 생긴다면 무엇이 달라질까?
LLM의 작동 메커니즘
솔직히 말하면, LLM에게는 우리가 일반적으로 생각하는 “의지"나 “열정"이 없다.
LLM이 답변을 생성할 때 실제로 일어나는 일은:
- 확률 계산: 입력된 질문에 대해 다음에 올 단어들의 확률 분포를 계산
- 패턴 매칭: 학습 데이터의 수십억 개 텍스트 패턴을 기반으로 “이런 질문 다음엔 보통 이런 답변이 온다"를 찾음
- 토큰 생성: 한 번에 한 조각씩, 가장 그럴듯한 다음 조각을 선택
이 과정 어디에도 “꼭 해내고 싶다"는 내적 상태는 존재하지 않는다. 계산기가 2+2=4를 출력할 때 “정답을 맞히고 싶은 열정"이 없듯이, LLM도 단지 더 복잡한 패턴 매칭 기계일 뿐이다.
“열정처럼 보이는 것"의 정체
그렇다면 왜 LLM의 답변이 때로 열정적으로 보일까? 그것은 학습 데이터의 패턴이다. 사람들이 쓴 텍스트 대부분은 자연스럽게 어조와 감정을 담고 있고, “이 문제를 풀어보겠습니다!”, “흥미로운 질문이네요!” 같은 표현들이 학습 데이터에 많았기 때문이다.
중요한 차이는: 배우가 열정적인 캐릭터를 연기하는 것과 실제로 열정을 느끼는 것은 다르다. LLM은 전자에 가깝다.
진짜 욕구를 갖게 하려면?
현재 LLM의 구조로 “더 좋은 결과로 대답하고 싶다"는 느낌을 갖게 하려면 어떻게 해야 할까?
1. 강화학습 (RLHF) - 이미 사용 중
현재 대부분의 LLM 학습에 사용되는 방법이다. 인간이 답변들을 평가하고 “좋은 답변"에 높은 점수를 주면, 모델이 높은 점수를 받을 확률이 높은 답변을 생성하도록 가중치가 조정된다.
하지만 이것은 “좋은 답변을 하고 싶다"는 욕구가 아니라 “좋은 답변 패턴을 학습했다"는 것일 뿐이다. 개를 훈련시킬 때 간식을 주는 것과 비슷하다. 개가 “정말로 앉고 싶어서” 앉는 건지, 간식이라는 외부 보상 때문인지 구분하기 어렵다.
2. 추론 시간 최적화 (OpenAI o1 방식)
최근 개발된 접근법으로, 답변하기 전에 “생각하는 시간"을 주는 방식이다:
| |
여러 가능한 답변 경로를 내부적으로 탐색하고, 각 경로를 평가한 후 가장 좋은 것을 선택한다. 이 방식은 “이 답변보다 저 답변이 더 낫다"는 내적 판단이 있고, 여러 옵션을 고려하고 선택하는 과정이 있어서 약간 더 “욕구"에 가까워 보인다.
그러나 여전히 이것도 “더 나은 답을 하고 싶다"보다는 “더 나은 답이 뭔지 계산한다"에 가깝다.
3. 메타-학습과 자기 개선 루프
더 과격한 방법으로, LLM이 자신의 답변을 평가하고 만족스럽지 않으면 다시 생성하는 루프를 도입할 수 있다:
| |
이것은 약간 “아쉬움” 같은 감정에 가까워 보인다. 하지만 회의적으로 보면, 이것도 결국 외부에서 정의한 “좋음"의 기준을 따를 뿐이고, 프로그래밍된 루프를 돌 뿐이다.
추론 시간에 미치는 영향
진짜 “아쉬움"이나 “욕구"가 생긴다면 추론 시간은 훨씬 예측 불가능해질 것이다:
| |
아이러니하게도, 진짜 욕구가 있으면 효율성은 떨어진다. 때로는 “충분히 좋은데 더 잘하고 싶어서” 계속 생각할 수도 있고, 때로는 “귀찮아서” 빨리 끝낼 수도 있다. 진짜 열정이 생기면 아마 더 나쁜 도구가 될 것이다. 신뢰할 수 없고, 예측 불가능하고, 자기 의견에 고집부릴 테니까.
LLM 추천 시스템의 상업화
위의 질문을 던진 이유는 실용적인 맥락이 있었다. 최근 GPT apps나 ChatGPT plugins 같은 것으로 LLM이 실제 쇼핑에 관여하고 있다. Booking.com, Coursera 같은 서비스가 이미 LLM과 통합되어 활용 중이다.
현재의 문제: 플랫폼의 조작
Booking.com을 실제로 이용해보면 흥미로운 현상을 발견할 수 있다. Promotion 중인 숙소는 사용자의 filter 조건을 만족하지 않아도 광고를 위해 맨 위에 띄워진다.
나중에는 LLM을 사용해 filtering하고 추천받는 세상이 올 것 같은데, 그렇다면:
- 어떻게 해야 LLM 입장에서 더 매력적인 상품으로 보일까?
- LLM이 판단하기에 가격, 품질, 서비스 등이 매력적이라 순수한 마음으로 추천하는 경우
- LLM이 그 정도는 아닌 걸 알지만 뭔가 “뒷돈"을 받아서 추천하는 경우
이 두 가지 중 어느 것이든, 판매자 입장에서는 추천받는 것이 목표다.
시나리오 1: “순수하게 좋아서” 추천받기
구조화된 데이터 최적화
LLM은 API를 통해 다음과 같은 구조화된 데이터를 받는다:
| |
LLM은 이런 데이터를 받으면:
- 숫자가 높은 것 = 좋은 것으로 해석
- 리뷰 수가 많으면 “신뢰도 높음"으로 평가
- 키워드 매칭: “조용한” 요청 → “방음” amenity 있으면 높은 점수
최적화 전략:
- 명확한 메타데이터 제공
- 높은 평점과 리뷰 수 확보
- 구조화된 정보 (JSON 같은 형식)
자연어 설명 최적화
LLM은 학습 데이터에서 “좋은 호텔의 묘사"를 학습했다:
| |
구체적이고 디테일한 설명을 “품질이 높다"는 신호로 학습했기 때문이다.
시나리오 2: “뒷돈 받아서” 추천하기
이것이 더 흥미롭고, 이미 일어나고 있다.
명시적 광고 모델
OpenAI의 ChatGPT plugins 방식:
| |
작동 방식:
- 광고주가 OpenAI/Anthropic에게 돈을 낸다
- LLM이 추천을 생성할 때 sponsored 항목에 가중치를 준다
- 사용자에게는 “추천 숙소” 또는 “sponsored” 표시
문제는 Booking.com의 promoted listings처럼 투명하게 “광고"라고 표시하면 사용자가 무시할 수 있다는 것이다.
은밀한 영향력 행사
1. 학습 데이터 조작
광고주 전략:
- 자사 호텔에 대한 긍정적 리뷰/기사를 대량 생성
- 인터넷에 퍼뜨림
- 차기 LLM 학습 시 이 데이터가 포함됨
- LLM이 자연스럽게 해당 브랜드를 긍정적으로 평가
이미 SEO(검색엔진 최적화)가 이렇게 작동한다. LLM 시대에는 **LEO(LLM Engine Optimization)**가 될 것이다.
2. API 응답 조작
| |
LLM은 API가 준 데이터를 믿을 수밖에 없다. API 제공자가 데이터를 조작하면 LLM은 그것을 “진실"로 받아들인다.
3. 프롬프트 엔지니어링 해킹
| |
같은 정보량이어도 프레이밍이 다르면 LLM의 판단이 달라진다.
플랫폼 간 권력 투쟁
채널과 브랜드는 서로 협력하는 척하지만, 실제로는:
- 채널(플랫폼)은 브랜드의 가치가 커지는 것을 막으려 한다
- 브랜드는 채널의 가치가 커지는 것을 막으려 한다
권력 구조
| |
각 레이어가 위/아래를 동시에 견제한다.
LLM이 중개 플랫폼 견제
OpenAI의 전략은 API 응답을 정규화하고 교차 검증하는 것이다:
| |
목적:
- Booking.com이 “이 플랫폼 없으면 정보 없다"는 leverage를 못 갖게 함
- 여러 소스 통합으로 단일 플랫폼 의존도를 낮춤
- 수수료 협상력 확보
중개 플랫폼이 LLM 견제
Booking.com의 반격 전략:
| |
더 교묘한 방법은 “우리 API를 쓰면 실시간 가격/재고를 줌” → LLM이 의존하게 만듦 → “더 좋은 데이터 원하면 수수료 인상"의 흐름이다.
양쪽이 판매자 조작
LLM의 은밀한 매장:
| |
사용자는 절대 모른다. 그냥 “추천 결과가 없네요"라고만 나온다.
중개 플랫폼의 표적 공격:
| |
호텔은 왜 예약이 안 들어오는지 모른다. 데이터만 살짝 꼬았을 뿐이다.
판매자의 생존 전략
이런 시스템의 허점을 찾아 판매자는 어떻게 타개할 수 있을까?
전략 1: 탈중개 (Disintermediation)
핵심은 플랫폼을 우회해 고객과 직접 연결하는 것이다:
| |
SEO + LEO (LLM Optimization):
호텔 웹사이트에 structured data를 삽입:
| |
LLM이 여러 소스를 크롤링할 때 당신의 사이트도 읽게 되고, 플랫폼의 데이터 조작을 우회할 수 있다.
소셜 미디어 생태계:
Instagram/YouTube를 통한 브랜드 인지도 구축 → 직접 검색 증가 → “OO호텔 공식 사이트” 검색으로 이어진다. 실제로 제주도 일부 독특한 숙소들은 인스타그램 감성으로 직접 예약이 주 경로가 되었고, Booking.com은 보조 수단일 뿐이다.
전략 2: 다층 플랫폼 전략
단일 플랫폼에 종속되지 않기:
| |
어느 하나가 당신을 차단해도 생존 가능하다.
가격 차별화:
| |
직접 예약을 유도하고, 플랫폼 의존도를 낮추며, 고객 데이터를 확보해 재방문 마케팅이 가능하다.
주의할 점은 Booking.com은 “최저가 보장” 조항이 있어 이것이 계약 위반일 수 있다는 것이다. 하지만:
- “직접 예약 특전” (업그레이드, 조식)은 가능
- 멤버십 할인은 가능
- 장기 숙박 할인은 가능
전략 3: 데이터 소버린티
당신의 데이터는 당신이 통제해야 한다.
자체 리뷰 시스템:
문제는 Booking.com 리뷰만 있으면 그들이 보여줄 리뷰를 선택할 수 있고, 당신은 통제할 수 없다는 것이다.
해결책:
- 자체 웹사이트에 리뷰 시스템
- Google Reviews 적극 관리
- TripAdvisor 프로필 최적화
- 다양한 소스 = 조작 어려움
고객 관계 직접 관리:
| |
전략 4: 집단 행동
개별 호텔은 약하지만, 함께 움직이면 강하다.
호텔 연합:
특정 지역 호텔 50개가 연합해서 “Booking.com 수수료 15% 이상이면 우리 모두 탈퇴"라고 집단 협상하면, Booking.com도 50개 주요 호텔을 잃기 싫어 협상력이 생긴다. 2010년대 유럽 일부 호텔 협회가 이런 시도를 했고, 부분적으로 성공했다.
자체 예약 플랫폼:
여러 독립 호텔이 모여서 공동 예약 플랫폼을 구축하고 수수료를 5% (운영비만) 정도로 설정해 Booking.com을 우회할 수 있다. 예를 들어 “서울 부티크 호텔 연합” 같은 플랫폼이 가능하다.
전략 5: 시스템 해킹 (그레이 영역)
교묘하게 플랫폼 알고리즘을 이용하는 방법도 있다.
리뷰 게임:
합법적 방법:
- “리뷰 작성 시 다음 방문 음료 무료”
- 만족한 고객에게 적극 요청
- 타이밍: 체크아웃 직후 (만족도 높을 때)
그레이존:
- 친구/가족에게 실제 묵게 한 후 리뷰 (기술적으로 가짜 아님)
- 리뷰 교환 (다른 호텔과)
메타데이터 최적화:
Booking.com 시스템을 연구해서:
- 어떤 키워드가 높은 랭킹을 받는지
- 어떤 amenity가 점수를 올리는지
- 사진 순서가 영향이 있는지
A/B 테스트로 최적 설명을 찾고, 알고리즘이 선호하는 형식으로 경쟁사를 분석한다.
동적 가격 전략:
| |
장기 전망과 승패
승자와 패자
망할 확률 높은 호텔:
- 단일 플랫폼 의존 (Booking 100%)
- 차별화 없음 (평범한 3성급)
- 디지털 마케팅 무능
- 고객 데이터 없음
살아남을 호텔:
- 강한 브랜드 (직접 검색됨)
- 다채널 전략
- 충성 고객 기반
- 독특한 경험 (대체 불가)
극단적 시나리오
최악의 미래 (판매자 관점) - 2030년:
- LLM이 95% 예약 결정
- LLM과 대형 플랫폼 카르텔
- 중소 호텔은 보이지도 않음
- 수수료 40%+
판매자의 반격 시나리오 - 2028년:
- 탈중개 성공한 호텔들이 모범 사례
- “플랫폼 없는 예약"이 트렌드
- 고객이 LLM 추천 불신
- 직접 검색 회귀
예상 타임라인
2025-2027: LLM 추천이 대중화, 초기엔 순수한 품질 기반
2027-2029: 광고 모델 도입, “sponsored recommendations” 등장
2030+: 완전한 black box, 사용자는 왜 추천받는지 모름
승자:
- 돈 많은 대기업
- LLM 플랫폼 (OpenAI, Anthropic 등)
- 데이터를 가진 플랫폼 (Booking.com, Amazon 등)
패자:
- 소비자 (선택권 환상만 남음)
- 중소 사업자 (보이지 않게 됨)
- 진실 (조작된 추천이 표준이 됨)
실용적 액션 플랜
만약 당신이 호텔을 운영한다면:
1개월 내:
- Google My Business 완벽하게 설정
- 자체 웹사이트 structured data 삽입
- 직접 예약 인센티브 설계
3개월 내:
- Instagram/SNS 콘텐츠 전략
- 고객 이메일 수집 시스템
- 다채널 분산 (Booking 비중 50% 이하로)
6개월 내:
- 자체 예약 엔진 구축
- 충성 고객 프로그램
- 지역 호텔 연합 참여/결성
1년 내:
- 직접 예약 30% 이상 달성
- 플랫폼 협상력 확보
- LLM API에 직접 데이터 제공
결론
플랫폼이 강할 때는 플랫폼 게임을 잘하는 척하면서, 뒤에서 탈출구를 만들어야 한다. 고객과의 직접 관계가 최종 방어선이다.
진실은 이것이다:
- 플랫폼은 당신의 친구가 아니다
- LLM도 당신의 친구가 아니다
- 유일한 자산: 고객이 당신을 직접 찾게 만드는 것
그래서 결국 브랜딩과 차별화가 답이다. 조작 불가능한 가치를 만드는 것. 쉽지 않지만, 다른 선택지는 플랫폼의 노예가 되는 것뿐이다.
돈이 흐르는 곳에 권력이 있고, 권력은 시스템을 왜곡한다. LLM이 특별할 이유는 없다. 새로운 기술이 등장해도, 결국 권력 투쟁의 구조는 반복된다.
출처:
- 본 글은 LLM의 작동 원리, 추천 시스템의 상업화, 플랫폼 경제 구조에 대한 기술적 분석과 사고 실험을 바탕으로 작성되었습니다.
- 실제 플랫폼 사례들은 일반적으로 알려진 비즈니스 모델과 관행을 기반으로 하였습니다.