紫东太初是由中科院自动化所和武汉人工智能研究院联合推出的一个全模态大模型,它是在千亿参数多模态大模型“紫东太初1.0”基础上升级打造的2.0版本。紫东太初大模型支持多轮问答、文本创作、图像生成、3D理解、信号分析等全面问答任务,具有强大的认知、理解、创作能力,能够带来全新的互动体验。
紫东太初的主要功能
一、图像能力
- 图像描述:基于用户上传的图片素材,准确理解并回答图片识别类问题
- 目标检测:支持丰富品类的目标检测任务,能够判定目标类型、数量和对应的位置信息
- 图像检索:基于海量的高质图片素材库,能为用户搜索出关联度高的精致图片素材
二、语言能力
- 中文问答:准确理解用户输入的问题语境,并能做出准确的知识性问答
- 文本续写:基于用户输入的故事引导自动续写丰富故事内容
- 文本创作:准确理解用户输入意图,并生成语意连贯、逻辑通顺的文本内容
三、视频能力
- 视频描述:基于用户上传的视频素材,准确理解并回答视频识别、视频描述类问题
- 视频检索:基于海量的高质视频素材库,能为用户搜索出关联度高的精致视频素材
- 视频问答:基于用户上传的视频素材,准确理解并回答视频相关的问题,同时支持上下文信息理解和多轮问答
四、音频能力
- 音频鉴伪:紫东太初能判断当前音频是真人说话还是机器合成
- 音频事件分类:可检测当前音频中所包含的声音事件类型,目前支持11种单一声音事件和混合声音事件
- 语音识别:可将语音快速准确识别为文字,支持手机应用语音交互、语音内容分析多个场景
相关导航
暂无评论...