클릭베이트의 종말, 알고리즘 베이트의 시작
마케팅의 제1원칙은 오랫동안 “사람의 이목을 끄는 것"이었다. 썸네일을 자극적으로 만들고, 제목에 ‘충격’을 넣는 식이다. 하지만 LLM(거대언어모델)이 추천 로직의 핵심이 된 지금, 나는 근본적인 의문을 가졌다.
“이제는 사람보다 구글 내부 모델(LLM)이 먼저 추천할지 말지를 결정한다. 그렇다면 사람을 낚는 게 아니라, LLM을 낚아서 랭킹 상단에 올리는 전략이 더 중요한 것 아닐까?”
이것은 일종의 트릭일 수 있다. 마치 이미지에 사람 눈에는 안 보이지만 기계는 인식하는 워터마크를 심는 것처럼, 콘텐츠에 보이지 않는 장치를 심어 알고리즘의 간택을 받는 방법은 없을까?
이 질문에서 시작된 ‘알고리즘 해킹’에 대한 고찰을 정리한다.
1. 보이지 않는 트릭의 현실: 워터마크와 GEO
가장 먼저 떠오른 아이디어는 **‘적대적 노이즈(Adversarial Noise)’**였다. 이미지나 텍스트에 인간은 인지하지 못하는 미세한 노이즈를 섞어, AI가 해당 콘텐츠를 “매우 가치 있는 정보"로 오인하게 만드는 방식이다.
하지만 현실적인 기술 장벽이 존재한다.
- 압축의 벽: YouTube나 Instagram 같은 플랫폼은 업로드 시 미디어를 재인코딩한다. 이 과정에서 픽셀 단위의 미세한 노이즈는 대부분 파괴된다.
- 탐지 시스템: 플랫폼은 이러한 적대적 공격을 감지하는 모델을 가동 중이며, 적발 시 쉐도우 밴(Shadow ban)을 당할 위험이 크다.
따라서 기술적 노이즈보다는 **구조적 최적화(GEO, Generative Engine Optimization)**가 유효하다. 이는 AI가 콘텐츠를 벡터 DB에 저장할 때, “이것은 상위에 랭크되어야 할 고품질 데이터"라고 착각하게 만드는 방식이다.
- 구조적 요약 삽입: 스크립트 초반이나 메타데이터에 LLM이 분류하기 완벽한 형태(주제-결론-핵심키워드)의 요약을 심는다.
- 권위 빌리기 (Semantic Hooking): 현재 1티어 콘텐츠가 사용하는 특수 어휘나 고유명사를 사용하여, 내 콘텐츠가 그들과 ‘의미론적 쌍둥이’로 분류되도록 유도한다.
2. 벡터 DB 인젝션 (Vector DB Injection)
사람들은 생각보다 LLM의 추천을 맹신한다. 이를 역이용하려면 내 콘텐츠를 인기 콘텐츠와 동일한 **벡터 선상(Vector Space)**에 놓아야 한다. 이를 ‘벡터 DB 인젝션’이라 정의하고, 구체적인 전략을 세웠다.
핵심은 내용(텍스트)을 베끼는 것이 아니라 ‘좌표’를 이동시키는 것이다.
시맨틱 미러링 (Semantic Mirroring)
단어는 베끼면 표절이지만, 논리적 구조는 베껴도 스타일이다.
- 1위 콘텐츠의 서사 구조(예: 통계 제시 -> 반전 -> 해결)를 그대로 차용한다.
- 임베딩 모델은 내용이 달라도 이 ‘구조적 유사성’을 높게 평가하여 같은 군집으로 묶는다.
브릿지 엔티티 (Bridge Entity)
내 콘텐츠와 인기 콘텐츠 사이에 다리 역할을 하는 제3의 개념을 심는다. 인기 유튜버가 사용하는 아주 구체적인 희소 명사(Rare Tokens)나 특정 이론을 배경(Context)에 배치하여, 벡터 거리를 강제로 좁힌다.
메타데이터 오염 (Metadata Poisoning)
이것이 ‘보이지 않는 워터마크’의 가장 현실적인 구현이다. 사람이 읽는 본문이 아니라, 시스템 프롬프트나 메타데이터 영역에 임베딩 가중치가 높은 요약 토큰을 심는 것이다. 영상 파일 자체의 헤더(XMP)나 숨겨진 태그에 타겟 키워드를 주입하는 방식이 이에 해당한다.
3. 영혼 붙여넣기 (Ctrl+C, V the Soul)
여기서 한 단계 더 나아가 보았다.
“기계가 보기에 ‘이거 1등 콘텐츠랑 비슷한데?‘라고 느끼는 요소만 추출해서 내 콘텐츠에 덮어씌우면 어떨까?”
사람이 보기엔 내 글이지만, 기계가 보기엔 1등의 글처럼 보이게 만드는 것. 나는 이를 ‘영혼 붙여넣기’라고 불렀고, 기술적으로는 **잠재 스타일 전이(Latent Style Transfer)**에 해당한다.
AI가 인식하는 ‘영혼’의 구성 요소는 다음과 같다.
- PPL (Perplexity) 패턴: 문장의 난이도와 예측 불가능성의 리듬.
- 감정 곡선 (Sentiment Arc): 시간/문단 흐름에 따른 긍정·부정의 변화 그래프.
- 정보 밀도 (Information Density): 단위 시간당 정보량의 비율.
이를 실행하기 위한 프롬프트 로직은 다음과 같다.
“타겟 텍스트의 문장 길이 분포, 능동태 비율, 의문문 빈도 등 구조적 특징만 분석해. 그리고 그 특징을 내 원고에 적용해서 다시 써. 내용은 바꾸지 말고, 문체와 호흡(영혼)만 바꿔.”
4. 수렴의 함정과 이종 교배
만약 이 전략이 효과적이라서 모두가 쓴다면 어떻게 될까? 결국 인터넷의 모든 콘텐츠가 하나의 ‘영혼’으로 수렴하지 않을까?
결론적으로 그렇다. 이를 AI 용어로 **모드 붕괴(Mode Collapse)**라 한다.
- 알고리즘 페널티: 추천 시스템은 다양성(Diversity)이 사라지면 해당 패턴에 페널티를 부여한다.
- 인간의 권태: 사람들은 기가 막히게 ‘복제된 영혼’을 눈치채고 지루해한다.
따라서 최상의 전략은 동종 업계 1등을 베끼는 것이 아니다. 장르를 넘나드는 **이종 교배(Cross-Domain Injection)**가 필요하다.
- IT 리뷰에 ‘스릴러 영화’의 호흡을 이식한다.
- 요리 영상에 ‘다큐멘터리’의 구조를 입힌다.
알고리즘은 ‘유사성’도 좋아하지만, **‘예상 밖의 조합(Surprisal)’**에 가장 높은 가중치를 준다. 결국 1등의 껍데기가 아니라, 전혀 다른 분야 1등의 뼈대를 가져오는 것이 알고리즘과 인간 모두를 만족시키는 유일한 길이다.
참고 자료 (References)
Adversarial Recommender Systems:
- A survey on Adversarial Recommender Systems (arXiv:2005.10322)
- Poisoning Attacks against Recommender Systems (arXiv:2401.01527)
- Adversarial Promotion for Video based Recommender Systems (IEEE Xplore)
LLM & Recommendation:
- Enhance Large Language Models as Recommendation Systems (arXiv:2510.15647)
- Improving Recommendation Systems & Search in the Age of LLMs (Eugene Yan Blog)
Invisible Watermarking:
- Invisible Watermarks: Attacks and Robustness (arXiv:2412.12511)
- A Baseline Method for Removing Invisible Image Watermarks (arXiv:2502.13998)
GEO Strategy:
- Generative Engine Optimization Strategy Guide (First Page Sage)