分享: |
用户:这个穿绿色衣服的球员在整个视频都做了什么?GLM-4V-Plus:在整个视频中,穿绿色衣服的球员在场上运球,然后跳起将球投入篮筐。用户:这个视频的精彩时刻是什么?发生在第几秒?GLM-4V-Plus:这个视频的精彩时刻发生在第4秒,当时穿绿色衣服的球员跳起并将球投入篮筐。此次,文生图模型迎来最新版本 CogView-3-Plus,其效果接近目前最佳的 MJ-V6 及 FLUX 等模型,并支持图片编辑功能。效果如下:GLM-4-Plus 现已在智谱大模型开放平台部署,企业和开发者即日起可以通过智谱开放平台 上的 API 调用智谱最新的基座大模型。另外,智谱AI 技术团队在现场表示,清言 app 也迎来重要更新,新增全新的“视频通话”功能,这是国内首个面向 C 端开放的视频通话功能。据介绍,清言视频通话跨越了文本模态、音频模态和视频模态,并具备实时推理的能力。现在,用户拨打清言的视频通话窗口,即可与它进行流畅通话,即便频繁打断它也能迅速反应。只要打开摄像头,我们看到的画面,清言也可以看到,同时可以听懂指令并准确执行。这样的体验就如同和真人视频通话一样。以下为几大功能场景的 demo:随着视频通话功能的加入,清言 app 成为首个可以通过文本、音频、视频和图像来进行多模态互动的 AI 助手。此外,继发布并开源视频生成模型 CogVideoX 2B 版本后,智谱也将 CogVideoX 5B 版本正式开源,其性能进一步增强,已成为当前开源视频生成模型中的最佳选择。一直以来,智谱AI 为开源社区的发展做出了重要贡献,其开源模型累计下载量已突破 2000 万次。
来源:学术头条
展会咨询
世展网公众号 |
微信小程序 |
销售客服 |
门票客服 |