当前位置:首页 > 创业 > 正文

谁会成为下一个DeepSeek:近百家机构春节期间想托人投资,公司对商业化不感兴趣

  • 创业
  • 2025-02-11 08:13:04
  • 6

专题:DeepSeek为何能震动全球AI圈

谁会成为下一个DeepSeek:近百家机构春节期间想托人投资,公司对商业化不感兴趣

  “光是春节期间,就有近百家投资机构托人介绍,看看有没有机会投资DeepSeek。”

  面对国内AI公司深度求索发布的大模型DeepSeek的现象级走红,某天使投资人向澎湃新闻记者坦言,“我们需要思考,为什么像DeepSeek这样的项目,之前竟被我们错过了。”

  DeepSeek技术热潮引发全球性震撼,大洋彼岸多家科技巨头股价应声暴跌,人工智能龙头英伟达更是曾经一夜之间跌去4.3万亿元市值。

  “DeepSeek没有推广预算,也没有千万年薪挖人,就是目标明确地投入研究、发布产品。”上述投资人评论。另一家大模型独角兽向记者透露,“DeepSeek创始人梁文锋是一个有AI信仰的人,他坚持的技术浪漫主义,在业内非常知名。”

  “不要因为追随DeepSeek,而错过下一个DeepSeek,我们需要的不是一拥而上地追捧和模仿,人工智能时代将倒逼人类回归价值本源。”复旦大学计算机科学技术学院教授、上海市数据科学重点实验室主任肖仰华告诉记者。

  在他看来,DeepSeek的崛起,背后是中国AI力量的缩影,一批类似DeepSeek的人工智能创业公司正在站上世界舞台展露头角。

  为何是DeepSeek杀出重围

  “去年的我对DeepSeek爱答不理,现在是高攀不起了。”在上海某AI公司担任算法工程师的陶如对澎湃新闻记者笑言,身为国内顶尖高校的算法毕业生,去年他曾经接到过DeepSeek的橄榄枝,最后却因为担心公司不够知名、不会专注投入AI而放弃。

  在社交媒体上,不少应届生晒出DeepSeek的入职邀请,言辞之间颇为惋惜。

  同样“错失”DeepSeek的还有一圈投资机构,“DeepSeek公司高层明确对商业化不感兴趣,只想做技术研究。而投资机构需要通过公司进行商业化变现,对公司有收入利润和资本化诉求,还需要创始人让渡一定程度的股权和自由。”一位投资人坦言,实际上,AI投资的从业者,没有人不知道DeepSeek,早在爆火之前,就有人伸去了橄榄枝。

  但最终的结局是,没有一家VC(风投机构)成功地投进了这家公司。

  有了解DeepSeek人士向记者透露,自己曾经面试过一些AI领域的人才,最后拒绝了自己的公司,去了DeepSeek,理由是他们科研氛围好,是一个真正做事的团队。

  “从薪资待遇来看,DeepSeek在业内仅处于中等水平,并非最高。”他坦言,“人才密度或许比不上头部大厂,不是大厂的人不聪明,而是大厂的聪明人在技术之外耗费了太多精力。大厂虽薪资优厚,但内部斗争也较为激烈,想要心无旁骛地搞技术,反而不如DeepSeek这样的技术公司纯粹 。”

  “DeepSeek的火爆出圈有偶然因素,但更多是必然。”肖仰华告诉记者。

  “它背后的母公司幻方资本,在量化交易和智能金融领域有强大技术实力和算力基础。在2022年底OpenAI刚推出ChatGPT时,国内拥有万卡集群的,除了幻方没有几家。此外,在金融领域汇聚了大量AI相关人才,也让DeepSeek具备了深厚的人才优势。”

  “更重要的是心态上的变化。”肖仰华坦言,过去的AI企业大多急于求成,忙着刷榜、宣传、变现和给资本交代,而DeepSeek心态从容,专注技术探索,允许团队基于好奇心驱动研发,不急于商业变现。在环境因素上,DeepSeek公司所在的杭州创新环境先进,政府营造了宽容、允许试错和探索的氛围,只搭建平台,而不干预企业的创新方向,这非常利于企业发展。

  北京邮电大学智能交互设计专业副教授谭剑认为,DeepSeek带来的关键变革意味着,随着模型成本下降,在未来,高水平的AI应用将由中小企业接手推动、形成“百花齐放”的局面,并在中短期利好云计算、边缘计算、服务器这三类厂商。“目前,三大运营商和众多互联网计算服务平台已经接入了DeepSeek并提供互联网访问,可以预测,随着全民注册AI服务,这些传统云服务和计算平台的营收将稳定上升。”

  中国不止有DeepSeek

  DeepSeek的爆火出圈,也让外界看到,中国在大模型产业已经形成一批颇具实力和影响力的公司,其中有字节跳动、阿里、腾讯等大厂身影,也有月之暗面、智谱、MiniMax等初创企业。

  在DeepSeek火爆全网后的大年初一,阿里云通义团队发布旗舰模型“Qwen2.5-Max”,成为第二家可以比肩美国OpenAI公司o1系列的中国大语言模型,再次引发震动。

  据第三方平台榜单排名显示,“Qwen2.5-Max”以1332分排总榜第7名,超过深度求索的“DeepSeek-V3”以及OpenAI的“o1-mini”。而在数学和编程方面,“Qwen2.5-Max”则排名第1,在Hard prompts方面排名第2。

  AI独角兽“月之暗面”成立于2023年4月,法定代表人杨植麟毕业于清华大学。他在美国卡内基梅隆大学获得了博士学位,并在北京创业。据第三方机构数据,截至1月,月之暗面的企业估值已达到33亿美元。

  位于上海的人工智能独角兽MiniMax成立于2021年12月,旗下具备文本、语音、音乐、图像和视频等多模态大模型。一个值得关注的亮点是,在AI出海方面,MiniMax走在了国内最前列。最新数据显示,MiniMax旗下海螺AI海外版登顶去年12月全球AI视频榜,月访问量超2700万。

  刘华此前向澎湃新闻记者表示,美国在AI大模型技术方面整体处于领先地位,而在语音、视频等细分领域,中国大模型追赶速度很快,例如海螺AI和快手旗下的可灵大模型等都在美国有广泛应用,目前在这些领域,两国技术水平已达到不相伯仲的阶段。

  “实际上,如今美国在大模型技术的迭代和演进速度相比之前确实有所放缓。”刘华表示,“目前,美国头部企业已经或正在构建10万卡集群。甚至,为了训练更先进的模型,计划打造百万卡级别的集群。但百万卡集群的实现面临诸多挑战,其中当地是否有大型电力设施支撑是关键因素之一 。”

  在这样的背景下,中国企业正快速追平和赶超美国的竞争对手。DeepSeek宛如一条“鲶鱼”,再次激发AI竞赛的活力。

  “大模型领域目前尚未形成绝对的护城河,行业仍处于发展早期,距离成熟阶段还有很长的路要走。”AI行业资深观察者陈承向澎湃新闻记者表示,他猜测,大模型行业的竞争和内卷在DeepSeek爆火后会进一步加剧。

  “厂商之间的激烈竞争,最受益的无疑是大模型的使用者,也就是普通用户,他们将享受到大模型能力不断进化、性价比不断提升所带来的红利 。”

  一家知名AI公司向记者表示,DeepSeek并非完美无缺,v3模型主要在数学和代码等能力方面比较突出,其他通用类文本生成、理解等方面效果还有提升空间,关于其特别低的训练成本,并不包括所有成本。(编注:v3公布的训练成本约557.6万美元。有第三方报告指出,557.6万美元这个数字主要指的是模型预训练的GPU成本,并不包括研发、数据收集、清理等其他重要成本。)

  “DeepSeek爆火之后,无疑会激发行业内各方进一步投入到良性的技术竞赛中,这对整个行业的发展来说是极为有利的。目前在大模型赛道里,各家企业都在全力以赴地研发,力求取得更优异的表现,这种充满活力的竞争氛围十分难得。”另一家AI创业公司内部人士向记者坦言,“在这个阶段,谁会掉队、谁能脱颖而出都还是未知数。大家为了在竞争中生存和发展,肯定会投入更多资源,整个行业充满了活力和发展潜力 。”

  “DeepSeek效应”如何发酵

  FutureLabs未来实验室首席专家胡延平表示,DeepSeek已经成为了一种效应,包含了四个方面,即算力成本效应、用户引爆效应、信心提振效应和开源生态效应:“接下来会出现一个新的现象,很多略有实力的相关企业都会基于基座大模型来做各种各样的后训练、蒸馏微调、结合知识库等等,然后去面向千行百业,形成一个AI 2.0时代大模型产业的腰部后市场。”

  基于这样的观察,胡延平认为,AI行业接下来有三个有潜力的方向:第一个方向是在以大语言模型为代表的AI 2.0的第一个周期结束后,以多模态、具身智能、时空智能等为代表的第二个周期;第二个方向是AI大模型的后市场,即腰部和长尾的生态涌现;第三个方向是端侧AI Agent(智能体),特别是能够和工作流以及每个人的个性化需求相结合的部分。

  在肖仰华看来,很多AI初创企业有良好的高校背景,不缺人才和资金,但普遍存在心态着急的问题,过于急切,反而不利于原始创新。

  “企业需要更宽松的发展氛围,按照自身节奏和战略方向稳步发展。”他认为,实际上,现在各地政府都很关心AI企业,但缺乏真正优秀、拿得出手的企业,“政府的关心要适度,搭建好环境和平台后就不过多干预。过度关心可能会打乱企业发展节奏,做聪明的关心者更重要。”

  此外,DeepSeek的出现,证明了AI企业依靠烧钱卷“投流”“获客”的路径是不可行的,以往中国AI大模型“卷”算力、“卷”价格、“卷”获客、“卷”变现能力,如今人们更认可长期主义的原始创新,企业应当思考架构创新和低成本研发,而不是一味烧钱。

  “人工智能大模型是一个风险极大的投资赛道,投资金额巨大,而最终存活下来的只有几家企业,这意味着对很多企业的投资都会失败。”一家大模型企业副总裁告诉澎湃新闻记者,在目前的环境下,美元基金因为募资受限的原因,无法实现传统的“投融管退”路径,“大模型行业必须要接受一个现实,政府引导基金会发挥更重要的作用。”

  从形式上来看,他建议,可以参考现在国内、国际都比较通行的算力券。比如,现在国企可以建立算力集群为大模型企业提供算力,投资入股之后,大部分的投资资金又会以算力租赁费用的形式重新回到国资企业手里。

  肖仰华认为,大模型行业掀起的创业浪潮,意味着民营企业和小微企业在国家科技创新体系中扮演着重要角色,未来也将带动更多企业蓬勃发展。“企业在初创和小微阶段,往往最具好奇心和创造力。好奇心就像珍贵的火种,弥足珍贵,整个社会都应该精心呵护,让创新的种子在适宜的土壤中不断生根发芽,茁壮成长 。”

有话要说...