TikTok 用户涌入背景下,小红书是否应布局大模型技术
小红书的爆火,再次引发了对于其技术战略的讨论,特别是将小红书与当前最受关注的大模型能力联系在了一起。在过去的 2024 年,卷大模型已经成为了中国互联网大厂的标配,但是到了 2025 年,对于接下来的 AI 战略,小红书仍需做出关键抉择。
背景:从投资到自研的探索
小红书其实一直都在紧跟大模型的浪潮。2023 年初,ChatGPT 3.0 刚刚爆红不久,小红书就开始摸排国内相关的创业公司,并很快成为了 Minimax 在 A2 轮次的投资方之一,这轮同时入资的还有腾讯、小米、金山三家大厂。
这次投资之后,2023 年 9 月,小红书基于 Minimax 的大语言模型,开始在 App 中内测 AI 聊天功能的 AI 助手 Davinic(达芬奇),之后做出了同样基于 Minimax 的社交陪伴功能"AI 宠物小伙伴",用户可以创建自己的宠物角色。
如果说投资 Minimax 只是开胃小菜,那么追逐月之暗面则是小红书接下来的重头大戏。张宇彤是金沙江在投资小红书过程中的项目主导人。小红书要投大模型厂商,月之暗面自然通过张予彤的关系进入了小红书的视野。
这是月之暗面第三轮融资,总估值高达 9 亿美金,最初定下的投资方有三家,分别是小红书、云九资本、五源资本,各自有 1000 万美金的投资额度。小红书作为领投方,在金额上有所犹豫,想要增加到两千万至三千万之间,张予彤要求各方先打钱再开放信息,云九和五源就先以债的方式打过去了钱。
谁知道小红书这一犹豫,阿里就挤进了投资队伍,把这一轮估值撑到了 15 亿美金,小红书从领投方变成了跟投方。
除了投资,小红书也组建了大模型团队,负责人是前格林深瞳首席科学家、小红书 AI 创新负责人张德兵。他在 2023 年 10 月份的一次技术分享中说过,小红书大模型布局将主要围绕三个方向:一是多模态技术在小红书内部应用场景具体的落地,二是针对内容创作者、借助 AIGC 工具降本增效,三是更关注成本。
不久之后小红书自研语言大模型的消息开始传出,2024 年小红书开始灰度测试自研通用大模型基座'小地瓜'。
小红书产品和设计负责人邓超负责 AI 产品探索。截止到目前为止,小红书内部已经推出过多款 AI 产品,除了达芬奇和 AI 宠物外,小红书还有 AI 绘画产品'Trik'、文生图产品'此刻'、AI 搜索助手'搜搜薯'。2024 年底,小红书先后在站外和站内上架了 AI 搜索新产品'点点'和'问点点'。
小红书既然发力许久,并且在模型层和应用层都小有成绩,在接下来的 2025 年,要不要在大模型领域继续深入呢?如何深入?
能做、要做、就该做
对于这个问题,AI 科技评论与多位业内人士交流过,要和不要两个选项都有不少理由,而且都能言之成理。
战略必要性
支持方普遍认为,小红书要继续发力大模型,既有战略性的原因,也有产品力的考量。
小红书想要挣钱,主要有商业化和电商两条路可走,而在商业化方面,为了保持住小红书的内容调性,推荐系统中能够推送的广告占比必然有一个阈值,因此,搜索广告就是小红书的重要增长点。
小红书已经成为国内最重要的搜索平台之一,承接了百度和其他搜索平台的不少需求,目前日均搜索量(QV)已经超百度一半。想要延续搜索份额的增长势头,小红书就一定要在 AI 上持续发力,保证用户的搜索体验处于市场领先地位,进而扩大市场份额,最终成功实现商业化收入上的突破。
从战略上来看,小红书不仅应该做 AI 搜索,而且要大做特做,最好能够取代百度,成为国内最大的搜索流量池。
当前 AI 搜索是大模型应用的当红产品形态,海内外都有不少明星产品,Perplexity、kimi、夸克乃至豆包都被归为该类别。小红书与抖音是国内当前互联网流量最集中的两个社交平台,不少人认为 2024 年豆包的崛起是归功于抖音的流量扶持与字节底层基座模型的能力成长,因此小红书基于自身强大基座模型开发类 ChatGPT 产品 + 小红书平台的流量密码,也或有望弯道超车。
从这一角度看,小红书继续投入资源升级基座大模型、开发 AI 搜索与聊天产品有天然优势,还有行业先验模板豆包。将时间线拉长来看,假如未来五年、十年基于大模型的 AI 应用大爆发,小红书的 AI 产品也将是未来其穿越行业周期的一道护城河、入场券,即使大模型的投入大也是'一笔划算的帐'。
新型社交与用户需求
另一个关于大模型应用的想象是新型社交,如 MiniMax 开发的产品 Talkie。
新时代一定要设计新的社交产品和社交工具。但目前抖音与小红书已经能满足用户对新型社交的需求,因此社交的本质是在一个高密度社区里找到自己想找的人与内容,所以新型大模型社交产品的崛起会面临现有社交平台的流量围剿;反之,现有社交平台基于大模型升级原有平台的社交功能则有天然优势。小红书与其成为被新生代事物挑战的被动方,不如成为发起挑战的主动方。
第二点原因,则在于小红书用户的多元化,以及由此产生的对各类 AI 工具的渴求。
小红书起身于图文社区,但是现在已经发展为一个涵盖图文、短视频、直播、群聊社交等多种媒介形态的平台。在内容的创作端和消费端,用户的需求已经越来越复杂。剪映诞生于辅助抖音的内容创作,即属于该逻辑。
在小红书群聊输入框的 + 号里,隐藏着小红书 AI 声聊的入口。这个产品可以帮助用户变声说话,用唱歌的方式聊天等等。
这是小红书发掘的其中一个社交需求场景。用户的新需求可能隐藏在各个角落,创作者有 AI 生成文案的需求,有 AI 编辑图片视频的需求,有直播间数字化场景的需求,有通过 AI 手段与粉丝互动的需求等等,这种场景小红书不去发掘,就会被站外工具发掘,甚至会影响到整个平台社区的氛围。
比如此前在《"TikTok 难民'大批涌入,小红书会面临什么技术挑战?》一文中提到的,不少人对跨语种的交流需求催生了一个全新的场景,那么小红书就有必要做一个多模态的翻译产品。
而且根据分析公司 Similarweb 的最新数据,小红书在本周早些时候,一天内就吸引了近 300 万美国用户,现在美国 iOS 和 Android 设备上的每日活跃用户约为 340 万,是上周同期的十倍有余。大批量的海外用户迫切需要小红书内嵌的翻译能力。
数据优势
除了战略和产品方面的考量外,支持方最重要的观点还是,小红书目前是国内最大的用户原创内容中心之一,图文质量很高,有效信息含量丰富。在多年来强调社区调性的运营管理中,社区互动氛围强,用户中'活人'占比多,语料库质量极佳。小红书拥有国内发展 AI 大模型技术最好的语料库之一,数据又成为下一代模型升级的关键,多元化多语种数据更是稀缺。
所以小红书在训练大模型的时候,先天就有数据上的优势,不仅远超六小虎,甚至超过国内绝大部分大厂。训练基座大模型,可以保证其技术的自主性与模型应用迭代的节奏控制。即使自己不做大模型的预训练,理论上也可以成为国内最好的语料库供应商之一,'小红书应该接住这泼天的富贵'。
没人、没钱、没必要
当然反驳者的意见也不容小觑。小红书当然有机会去做大模型,但是机会够不够大,值不值得小红书全力投入呢?
人才瓶颈
质疑者的第一条理由就是技术人才的问题。
小红书不是一家以技术见长的公司,强运营、强策划是小红书不断破圈的杀手锏。但是训练大模型,是一件技术要求极高的工作。
AI 科技评论与多位业内人士讨论过,要想做大模型,最重要的是找到合适的人。甚至于,只要找到了正确的人,一个大模型的训练团队,可能只要十来个人就能做起来了。不止一位从业者认为,上一代所有的 AI 人才,不论是搞 CV 的,还是搞 NLP 的,看到大模型仍然要从头学起,之前积累的经验几乎是一夜清零。
小红书目前大模型的带头人张德兵,此前的履历是格灵深瞳的首席科学家,博士毕业于浙江大学,师从著名的计算机视觉与机器学习专家何晓飞教授。
张德兵是一位在学术届和在产业界成果突出、经验丰富的计算机视觉专家,但他此前也没有训练过超大规模集群下的大语言模型,并没有相关的经验。
至于小红书另外的三个算法团队,核心人物中的风笛原是阿里算法策略专家,凯奇是原凤巢首席架构师,吴毅是百度搜索算法专家,更不了解大模型。
除了算法人才,训练基座大模型也需要优秀的 Infra 人才搭建万卡集群。相比算法人才,国内优秀的底层基础设施与系统人才更加凤毛棱角,少数的几个人才也已经被字节、阿里等大厂与头部大模型独角兽公司瓜分。小红书要吸引这些人才,难度非同小可。
缺人,这是小红书训练大模型面临的第一个问题。
资金压力
第二个问题是,大模型实在太花钱了。
一个通用大模型进行一次预训练的费用,就要千万美金以上,这还不包含人力成本、算力成本、后续的优化、模型的更新和部署等费用。大大小小的费用相加,等到模型真的能用,至少要五千万美金起步了。
大模型已经成为一个比拼财力的赛道。字节过去一年在 AI 研发上的投入超过百度阿里腾讯三者的总和 1000 亿元人民币。在六小虎中融资额相对较少、只有数亿美金的零一万物,现在也已经放弃了预训练。
根据公开报道,小红书在 2023 年才首次实现历史性突破扭亏为盈,当年营收 37 亿美元,净利润 5 亿美元。到现在刚盈利两年的小红书,能在大模型上投入多少钱?
更何况,小红书的大模型能力,在同行之间不具备竞争力,也没有云业务的加持,就没办法成为一个赚钱的业务,纯属烧钱的行为,小红书应该既不愿、也不能长期支撑这样的投资行为。
模型无关论
至于不支持小红书做大模型的最后一个理由,则是目前业界的共识:模型无关论(Model-Agnostic)。
在 Scaling Law 见底,Transformer 架构仍然一统天下的今天,市面上的诸多大模型从能力上来讲没有本质的差别,用户的使用体感上各有千秋,但整体而言,没有代际差异。
多个 AI 应用团队告诉 AI 科技评论,从 2024 年年中 Claude Sonnet 3.5 发布后开始,他们在开发大模型应用时就是普遍接入 4、5 个不同的基座大模型,因为多家基座模型的性能都已能媲美 OpenAI,'大模型就像电源一样即插即用',所以不同基座模型的迭代速度不再影响上层应用的开发。
在当前第一梯队的大模型中,现在的 AI 产品无论选择使用哪一个,只要经过合理的 fine tune,最终结果也都大差不差。更何况,AI 产品可以选择多个大模型,可以随着产品特征,或者是用户需求主动切换大模型。小红书做 AI 产品的时候,也可以走这样的路线。以现在的 API 价格之低,用基座模型厂商的模型,还是一种省钱行为呢。
技术实施路径建议
基于上述正反双方的讨论,如果小红书决定推进 AI 战略,建议采取务实的技术实施路径,而非盲目追求全栈自研。
RAG 与知识库构建
对于小红书而言,最核心的资产是其海量的 UGC 内容。利用检索增强生成(RAG, Retrieval-Augmented Generation)技术,可以将大模型的能力与小红书的知识库结合。这样既能保证回答的准确性,减少幻觉,又能充分利用现有的数据价值。
具体实施上,需要建立高效的向量数据库,对图文内容进行深度清洗和向量化处理。针对垂直领域的问答,可以通过微调开源模型(如 Qwen、Llama 系列)来适配小红书的社区语境,而不是从头预训练基座模型。
成本优化与推理加速
在算力成本方面,可以采用混合部署策略。对于高频、低延迟的场景,使用蒸馏后的轻量级模型;对于复杂任务,调用外部 API 或高性能集群。同时,引入量化技术(Quantization)和推理加速框架(如 vLLM、TensorRT-LLM),以降低显存占用和提升吞吐量。
此外,考虑到多模态数据的特殊性,小红书应重点优化图文理解能力。通过训练专门的视觉编码器,提升模型对笔记图片、商品细节的理解精度,从而更好地服务于电商转化。
合规与安全
在推进大模型落地的过程中,数据隐私和内容安全是重中之重。必须建立严格的数据脱敏机制,确保用户隐私不被泄露。同时,需要部署内容过滤系统,防止模型生成违规或有害信息,维护社区的良性生态。
结语
在多方讨论之后,AI 科技评论认为,小红书接下来,应该全力以赴去做 AI 产品,不要投入精力去做大模型。
AI 搜索的产品特点,既契合小红书自然生长的搜索流量,也能利用好小红书上规模庞大的优质语料库。这是小红书应该抓住的战略级机会。
在现有条件下,小红书可能还缺乏做大模型的能力,与其勉强自己,不如使用开源模型,或者只需要接入 API,先解决平台上的 AI 产品问题,将小红书打造成引领 AI 时代的社区平台。
未来的竞争不在于谁拥有更大的模型,而在于谁能更好地将模型能力融入业务场景,为用户提供真正有价值的服务。小红书应聚焦于应用层的创新,利用数据优势构建差异化壁垒,而非陷入基础模型建设的军备竞赛。