紫东太初2.0,由中科院自动化所与武汉人工智能研究院携手推出,作为“紫东太初1.0”的升级之作,它汇聚了千亿参数的智慧,为我们呈现了一个功能全面、性能卓越的全模态大模型。
一、图像处理能力
图像描述:精准解读用户上传的图片,快速回答图片识别类问题。
目标检测:识别多品类目标,准确判断类型、数量和位置信息。
图像检索:基于海量高质量图片库,为用户搜索高度相关的图片素材。
图像生成:根据用户指令,生成精美图片,并支持微调内容。
文字识别:支持多场景、多语种、高精度的文字检测与识别。
二、语言处理能力
中文问答:精准理解问题语境,提供准确的知识性回答。
文本续写:基于故事引导,自动生成丰富内容。
文本创作:准确理解用户意图,生成连贯、通顺的文本。
标题生成:快速提炼文章要点,生成精简标题。
语法分析:准确分析中英文句子语法,提醒并修改错误。
机器翻译:支持中英文、文言文与白话文互译。
古诗创作:即兴创作诗歌、绝句等。
代码理解与编写:理解多种编程语言,快速解答代码问题,辅助编写代码片段。
数学计算与逻辑推理:处理各类数学问题,支持复杂逻辑推理。
三、视频处理能力
视频描述与检索:基于视频素材,准确回答相关问题,搜索关联度高的视频。
视频问答:支持视频相关问题的多轮问答,理解上下文信息。
四、音乐处理能力
音乐生成:根据文本提示生成高质量音乐,支持多种风格和乐器。
音乐多模问答:基于音乐素材完成多模态问答任务。
五、音频处理能力
音频鉴伪:判断音频是否为真人发声。
音频事件分类:检测音频中的声音事件类型。
语音识别与合成:将语音快速转换为文字,或将文字转换为自然流畅的语音。
六、3D与信号处理能力
3D场景描述:基于点云数据,实现3D场景理解和物体感知。
信号识别:支持雷达信号鉴别与知识交互,快速掌握信号来源及参数。
访问紫东太初官网(taichu-web.ia.ac.cn),点击对话体验。
注册/登录账号,成功登录后跳转到对话界面。
输入问题或选择推荐提示指令,发送后等待紫东太初的智能回答。
如何申请试用?
访问官网,点击注册,填写相关信息并提交申请,审核通过后即可体验。
支持上传文件吗?
支持上传图片、视频、点云、音频、音乐、信号等多种文件类型。
是否通过生成式AI备案?
紫东太初大模型已通过《生成式人工智能服务管理暂行办法》备案,可正式面向公众提供服务。