分享: |
5月22日,天眼查显示一家主攻多模态大模型的初创公司“智子引擎”,完成了千万元天使轮融资。
这家初创企业的 CEO 是 90 后小伙,中国人民大学博士生“高一钊”,他的导师“卢志武”在公司担任顾问一职。两人均来自于国内最早从事多模态大模型研究的团队——中国人民大学高瓴人工智能学院。
被市场热度倒逼,学术界入局大模型是必然趋势。早在今年 2 月,维科网人工智能曾报道复旦大学邱锡鹏教授团队发布国内首个类 ChatGPT 模型 MOSS。5 月初,清华一脉青年力量“25岁小伙曾国洋”创办“面壁智能”研发“知海图AI”大模型,获融资千万。今天,高一钊展示了人大一脉的青年力量。
智子引擎成立于 2021 年 5 月,是一家多模态大模型初创公司,在今年 3 月份发布了第一款应用级多模态 ChatGPT 产品“元乘象 ChatImg”。
“元乘象 ChatImg”具备目前 GPT-4 尚不具备的图像生成技术,可以进行文字和图片的模态交互。其参数量大概在 150 亿,使用图文对数据和 VQA 数据作为训练集,根据用户输入的图片或文字,“元乘象 ChatImg”可以进行智能聊天、讲故事、写广告等。
“元乘象 Chatlmg”的多模态能力不止可以用来闲聊,还可以用来写搭配建议、商品文案、旅游宣传词…… 这些都是可以商业变现的场景。
在推出“元乘象 Chatlmg”两个月后的今天,2023年5月22日,“智子引擎”完成了千万元天使轮融资,投资方未披露。
智子引擎并非撞到好运,实际上,公司的核心团队成员在大模型研发上,已经深度参与了数年。
从最早说起便是 2020 年,北京智源人工智能研究院(国家科技部和北京市委市政府扶持成立)、中国人民大学、中科院计算所和清华大学联合开始中国的大模型——“悟道”的研究。人大高瓴人工智能学院科学家负责分支“悟道·文澜”的研究,卢志武任模型研发主力军。
当时,国内 NLP(自然语言处理)领域的研究已逐渐形成规模,但多模态大模型依然几近“无人区”。卢志武和中国人民大学高瓴人工智能学院团队面对着“想过河,但连一块石头都摸不着”的困境。在团队的持续努力之下,“无人区探索”有了初步的成果:2021 年 3 月第一代“文澜”(BriVL 1.0)问世、2021 年 6 月更强大的第二代文澜(BriVL-2)发布。
期间,高一钊也深度参与了文澜 1.0 和 2.0 的图文预训练工作,主要负责数据处理、模型训练和评估等。
ChatGPT 的热浪下,卢志武和高一钊看到了多模态研究在大模型时代的新机遇,成立多模态大模型公司“智子引擎”。
“智子引擎”的核心团队来自参与文澜模型的研发成员,今年 3 月 8 日推出自主研发的多模态对话大模型“元乘象 ChatImg”,此款类ChatGPT 一经发布便获得投资人青睐。
90 后 CEO“高一钊”和他的导师“卢志武”开始多模态大模型之旅始于 2020 年。
2020 年 5 月,OpenAI 发布 GPT-3,引发了国内从业者对大模型的关注,其中就包括了卢志武等人。
卢志武于 2005 年从北京大学数学科学学院信息科学系,获得硕士学位。后于 2011 年在香港城市大学计算机系取得博士学位,他主要的研究方向包括机器学习、计算机视觉等。卢志武在2013年在中国人民大学信息学院担任教职,现在是人大高瓴人工智能学院常聘副教授。
卢志武
当时,国内鲜少有研究者聚焦多模态大模型研究,高瓴人工智能学院率先组建了国内最早从事多模态大模型研究的团队。团队专门从事图文多模态预训练模型的研究和开发,由文继荣牵头,核心成员便是卢志武等人。
高一钊在 2020 年进入中国人民大学高瓴人工智能学院读博,师从卢志武。
高一钊
ChatGPT 引发狂欢以来,大厂喧嚣沸腾,创业公司也不遑多让。被市场热度倒逼,学术界入局大模型是必然趋势。在不同科研院所之间,也迎来了国产大模型“神仙打架”局面。
今年 2 月,复旦大学邱锡鹏教授团队发布参数规模达到 175 万级别,国内首个类 ChatGPT 模型 MOSS。
智源研究院研发了“悟道2.0”,参数规模 1.75 万亿级别,是中国首个全球最大万亿模型。
中科院自动化研究所发布了“紫东太初”,参数级别千亿级,是全球首个三模态大模型。
浙江大学杭州国际科创中心研发了“蛋白质大模型”,可以预测蛋白质序列的结构和功能。
上海人工智能实验室研发了"风乌”大模型,该模型在 80% 的评估指标上超越 DeepMind 发布的模型 GraphCast。
中国人民大学卢志武团队自主研发多模态对话大模型并落地了第一款应用“元乘象ChatImg”。
科研院所“西湖星辰”自研大模型的参数规模最多1000亿+。
清华大学发布了ChatGLM,参数规模 62 亿,在准确性和恶意性指标上与 GPT-3 接近或持平。
随着ChatGPT的火爆,国内“学院派”大模型纷纷亮相,国内科技机构围绕 AI 大模型正在上演“百团大战”。在中国规模庞大的互联网用户的支撑下,从算力到应用,国内已经按下了 AI 大模型发展的加速键。
至于哪方力量能接下 ChatGPT 的中国市场,我们拭目以待。
▼最新活动▲▼精彩视频▲
世展网公众号 |
微信小程序 |
销售客服 |
门票客服 |