您的位置:主页 > 公告动态 > 正大动态 > 正大动态

这届VC,投AI大模子「望而生畏」-香港期货开户

2023年,大模子狂飙;但一级市场却略显十动然拒。

一边,大厂跟大佬all in大模子的计划掀起赛道的狂热,有VC抢做一个吃螃蟹的人,数亿元融资成大模子投早标配。

譬如,启明携手经纬,数亿元天使轮投向周伯文开办的衔远科技;创新工厂孵化的AI 2.0 大模子澜舟科技,也续上一笔数亿元Pre-A轮,斯道资源和创新工厂延续加码。

但到了另一边,却好像现实照进理想,大模子自研所需的“钞能力”让不少VC望而生畏。

一次运算450万美元(约合3000万元)的开销,以及月薪2万至10万/人的重金求贤争取赛,让某家美元基金相关职员直接示意,“不关注AI大模子,太贵了。”

更有投资人直言,真真相形是项目基本抢不起来。一是估值系统还不成熟,几亿一轮融资,释放10到20个点的股权,估值马上超10亿,而这估值照样根据一个大模子烧GPU消耗的成本去盘算,而不是以其真正的商业价值去评估;二是海内存在商业化落地以实时机的不确定性。

“人人看好宏观趋势,也更愿意做跟投,但到详细项目,要领投可太需要勇气了。而且一起进场投,很可能会追高。”

但有VC放弃,就会有VC勇往直前。

有几家机构跟猎云网示意现在仍在延续学习中,但还未形成投资逻辑,处于想投然则多张望的状态。而这样的状态反映到项目端,却也引发了部门创业者的吐槽,有创业者示意,许多基金与其说是投资相同,不如说是找他们学习。

“有VC还在问一些很基础的问题,譬如大模子跟原来小模子有什么差异。天天给人教育,相当于酿成了一个免费的先生,后面的尽调也一直在问偏学术上的问题,商业上的考量都还没有聊到。”

显然,在一级市场投“真香”大模子上,多看少投甚至不投成为了大部门VC的一样平常。

01 海内大模子“冷饭热吃”

提及大模子,着实也不算什么新鲜观点。

外洋超大规模预训练模子始于2018年谷歌提出BERT大规模预训练语言模子,并在2021年进入“军备竞赛”阶段。

2020年,OpenAI推出GPT-3超大规模语言训练模子,参数到达1750亿,用了约莫两年的时间,实现了模子规模从1亿到上千亿级的突破,并能实现作诗、谈天、天生代码等功效。

再到2021年,谷歌推出的Switch Transformer模子成为历史上*万亿级语言模子多达 1.6 万亿个参数,并在12月提出了具有 1.2 万亿参数的 GLaM 通用希罕语言模子,在7项小样本学习领域的性能优于 GPT-3。

同期,海内超大模子的研发生长也很迅速,2021年成为中国AI大模子发作的一年。

商汤科技的盘算机视觉模子、华为云团结公布的盘古NLP超大规模预训练语言模子和盘古α超大规模预训练模子、阿里达摩院PLUG中文预训练模子以及团结公布的M6中文多模态预训练模子以及百度的ERNIE 3.0 Titan模子陆续面世,其中达摩院M6模子的参数到达10万亿,直接将大模子的参数提升了一个量级。

虽然那时海内院校跟大厂都在做大模子,但在银杏谷资源高级投资司理钟伟成看来,这更多是科研上的效果复现,对外洋较为前沿的AI模子的跟进。直到2022年年底StableDiffusion、ChatGPT的泛起,才最先让更多业内人士从张望走向下场。

“之前产物的商用价值并没有完全体现出来,大部门对照好的落地场景是心理慰藉的对话,或者文档的改写天生,以及此前的AI绘画。ChatGPT出来后,人人发现说可以通过多轮对话去做不停微调、上下文学习,然后去天生更好的内容。”

从手艺和战略层面上看,ChatGPT让更多人意识到这不只只是一个应用工具,甚至会成为一个新的PaaS层基础设施。从手艺和战略层面上,群雄争霸,都想试图成为一个新时代的基础设施供应商。

再到2023年,上市公司和大厂陆续放出做大模子的信号,AIGC观点股股价翻番,外加“AI的iPhone时刻 ”无不让这股热度从二级市场涌向一级,引发对语言大模子的重点关注。

风口之下,早年年最先结构的学院派等语言大模子创企从去年最先浮出水面,击中了有脱手压力的VC心巴。

钟伟成示意,多数投资人在大环境不确定下,会倾向于追求一些偏底层及回报较高、能最终形成一家独大的投资领域,外加对错过下一个时代风口的焦虑,使得语言大模子项目成为了市面上最为性感的一类投资标的。

然而赛道虽香,语言大模子的火爆表象下,手艺差距并不止一点。

以当前海内大厂语言基础大模子十几亿、几百亿的参数规模,以及大多数创业公司还在做一两百亿的参数模子来看,跟ChatGPT相比,尚有2-3年的距离。

02 VC看多投少,项目端狂蹭热门

正如上文所说,现在VC看大模子,光看鲜脱手。

一方面,是由于一些基金是从AIGC火了后,才研究和关注大模子,最先找项目,正处于学习阶段,而更主要的缘故原由是贵。

以OpenAI为例,其在推出GPT3的API接口出来之前,已经烧了好几亿,后在微软百亿美元狂砸下,才有了GPT3的面世及能力的涌现。

以是想要对标ChatGPT,资金必不能少。

钟伟成示意,已往,团队健全的大佬创业项目,一样平常*轮估值2-3亿元就已经很高。但放到大模子创企来说,光1年租1000张GPU卡就要花大几万万到1亿元的支出。

连云港成立一支20亿新基金

“这还只是试错的成本,万一手艺路径选错了,模子训练的历程中出了一些bug,重新弄基本吃不用。天使轮估值就这么高,等退出还要7-8年,跑出来的还纷歧定是投资的那一家。冒着整支基金回报的风险去投大模子,是项目推进时较大的阻力。”

与此同时,差异靠山的基金之间,对于基金存续期以及试错风险的蒙受度都有差其余要求,部门基金会要求被投企业尽早做商业化实验,而这样的投资模式跟慢工出细活的通用基础大模子并不适配。

就现在来说,旗下有美元基金的机构存续期较长,更容易下注投资语言大模子,但就现在主要投资早期轮来看,随着语言大模子项目到第三四轮,一轮5-10亿的砸钱下,估值到50亿元后,谁来接盘又成为问题。

在钟伟成看来,与百度阿里等大厂,有内部资金支持科研团队去做差异,海内语言大模子创企,投资风险高就在于不确定因素太多,早期VC基金攒局投完以后,后期轮照样需要国资机构的投资介入,辅助创企缓和资金量,才气推动扶持出一家头部企业。

他不禁感伤,“别看创业公司去做语言大模子似乎很热闹,最后的名目可能照样一家稀奇大,两家相对小的中文语言大模子存活下来。”

与此同时,以现在市面上的大模子项目来说,蹭热门的也不在少数。

就华映资源董事刘天杰的感想来说,他从年底最先最先看AIGC的项目,已往是一个月看5-10个,现在是天天都要看3-4个,其中也许有1/4跟大模子相关。在他看来,现在项目多到已经成为继上一波移动互联网以来的新一轮全球怒潮。

“所有人都想*波冲进去,挺正常。现在许多做语音图像识其余中后期轮甚至上市公司都在蹭这一波热度,有些公司号称做大模子,但最终是面向应用的,其中大模子也得分语言大模子,以及中度的促进性模子。”

故而在一级市场上,普遍VC接纳看多投少的节奏,尤其是在大模子底层还未确定能生长多快的情形下,美元基金偏好语言大模子,人民币基金则更偏向应用层,但总体脱手照样相当审慎。

此外,刘天杰还指出,上一波AI公司现在往AIGC靠拢,着实已经很难追上。事实上,这就是一场AI的自我革命。

“外洋大模子从2018年就最先研究,这不是一蹴而就的事情。传统判别式或者做卷积网络的AI团队现在跳出来讲大模子,然则他在传统AI手艺蹊径上投入了太多时间人力,历史肩负成为其困局所在。”

同时,刘天杰也坦言,在基础大模子领域,着实文字、图形甚至视频的创业时机都不大。

“由于这不是一个拥有几个算法天才就能解决的事情,你需要一个异常重大的算力基础,这可能现在连海内的大厂都没有,就更别说创业公司。同时你还需要一个伟大的高质量数据集基础,纯靠公网扒取、或者花钱去买,想要去做语言大模子真是挺难题。”

再回到现现在的大佬纷纷下场创业,在钟伟成看来也并非独具优势。

“许多大佬是约请了一些以前介入过大模子训练项目的人,把架构搭起来重造,但着实差异量级的语言大模子训练,在工程化上都有许多差其余坑需要去逐步攻克,从0最先做,偕行的竞争压力照样蛮大的。”

03 应用层暂时失宠,模子层投资时机在“细分”

短期来看,海内互联网大厂在研发语言及多模态大模子的节奏下,未来3-5年会泛起种种差异垂直领域的大模子,甚至细分到各个公司私有化部署的大模子。

在这样趋势下,各家都市有一个尝鲜期。

在钟伟成看来,这就跟已往的中台观点很像,短期内引发一波需求,会有许多大厂或初创公司,去辅助大企业炼制自己的AI大模子。而中国的市场内里,久远来看照样会走出一两家通用的语言大模子,由百家争鸣的状态走向大一统,且现在来看互联网大厂的胜率较大。

“海内公域流量上的中文语料异常差,优质的中文语料又集中在各个差异大厂的私域场景里,譬喻抖音的视频数据、阿里的图文数据、百度的文本数据,尚有知乎跟小红书等,这些数据都是不会共享出来给外部去做通用的大模子训练。而有着私域数据及资金能力的互联网大厂训练各自领域的大模子后,再看哪一家有能力扩展到更多行业,酿成一个通用的语言大模子,我以为这是海内大模子对照相符常理的一个生长历程。”

那既然创业公司做基础大模子对标ChatGPT的时机不大,那么大模子创业还能往哪卷?

对此,有投资人给出一些谜底:投细分、投基础设施。

刘天杰示意,现阶段,海内有一些大模子在垂直领域的细分时机可以查漏补缺,包罗一些现在在国际上对照前沿的领域,好比3D大模子、视频大模子、多模态大模子等中型模子。

“微软英伟达,他们也没有足够多的3D数据去训练一个通用的3D大模子,而是用一些中型模子的路径或者说用一些模子监视强化学习的方式去迫近3D大模子。在这一点上,我以为海内公司是有时机的。”

对此,钟伟成也持相同看法。“关注垂直的语言大模子或多模态的大模子,海内创企照样有一定的数据优势,譬如字节或快手的人去做视频天生,就很有可能做成。我以为在垂直领域,市场规模足够大、你进得足够早,比别人先积累一些领域内的私有数据,很有可能做到行业一霸。”

此外,他也以为未来针对模子推理/训练的优化、AI推理/训练专用芯片等AI基础设施偏向,也是有对照明确的市场需求。

值得注重的是,现在相较于模子层,应用层暂时属于失宠状态。

已往移动互联网或元宇宙浪潮,其*特点是基础设施生长较慢,但基础设施架构上的应用生长较快。但到了这一波AI,基础设施不仅已经迎来发作式增进,更在大厂大模子的涌入下,不停转变着。

在刘天杰看来,这种情形下讲应用毫无意义,投入后一旦大厂发了一个新模子,就可能直接把应用干翻。

“在这种情形下,我们第二波才会看应用。现在的AI公司,若是能在现在中文大模子不那么完善的情形下,释放功效给C端积累大量的高质量数据集,那这家公司才有意义和价值。”

此外,据钟伟成透露,4月看大模子的投资人基本会对心仪的项目做最后推进,好几家已经close了。现在还在市面融资的大模子项目相对变少,但照样会有许多做应用的AIGC项目自动找上门。

在他看来,眼下大厂百家争鸣,大模子越割裂,对资原本说是一个利好,让投资机构有时机介入到垂直领域的大模子投资。但对于创业者来说,无论是模子层照样应用层,都需要想清晰,一是找到一个AI原生的细分领域,二是认真思索其所带来的根个性转变在哪,只是天生内容,照样内容的明晰及后续合成。

显然,这新一轮AI浪潮下,找VC拿钱的条件越来越高了。