钉钉AI升级多模态：能根据图片识人、翻译、创作、多轮问答

2024-03-28 11:35:25

导读【钉钉AI升级多模态：能根据图片识人、翻译、创作、多轮问答】!!!今天受到全网的关注度非常高，那么具体的是什么情况呢，下面大家可以一起...

【钉钉AI升级多模态：能根据图片识人、翻译、创作、多轮问答】!!!今天受到全网的关注度非常高，那么具体的是什么情况呢，下面大家可以一起来看看具体都是怎么回事吧！

1、【钉钉AI升级多模态：能根据图片识人、翻译、创作、多轮问答】钉钉AI助理迎来升级，上线图片理解、文档速读、工作流等产品能力，探索多模态、长文本与RPA技术在AI应用的落地。

2、基于阿里通义千问大模型，升级后的钉钉AI助理拥有更强的视觉推理能力和长文本速读能力。

3、目前，用户在钉钉IM消息框或点击魔法棒按钮进入AI助理对话框，发送长文件、在线文档、网页链接、视频内容，即可根据内容识人、识地点、分析、答题、翻译、摘要、提取文字，甚至可以通过多轮交互进一步做智能问答。

4、基于通义千问Qwen-VL-Max视觉理解模型，钉钉AI助理能够准确描述和识别图片信息，并根据图片进行信息推理、扩展创作、文字提取、翻译等。

5、此外，AI助理也支持视频内容的速读。

6、发送给AI助理的短视频、直播切片或培训视频可以被快速“观看”，AI助理会根据视频内容生成字幕，提取关键词，并生成一份智能摘要，对于最高2GB的视频内容，仅需3分钟即可完成智能解读。

7、（新浪科技）。

以上就是关于【钉钉AI升级多模态：能根据图片识人、翻译、创作、多轮问答】的相关消息了，希望对大家有所帮助！

标签：