Zpedia丨谁在主导腾讯AI？是落后还是克制？最完整的腾讯生成式AI年中盘点

丨引子

作为国内最大的互联网公司，腾讯是中国拥有最丰富的社交和文娱场景数据的科技公司之一。自23年3月以来，国内各大厂开始「百模大战」。然而直到9月7日，腾讯才姗姗来迟的发布了混元大模型。

此后，腾讯也没有像其他大厂一样高调大刷存在感，而是低调默默地建设 AI 基础设施、产业生态，以及探索应用到腾讯原有业务和产品。与此同时，腾讯主要的竞争对手字节正在大模型赛道火力全开，内部布局完成了组织架构调整，还连续推出了十多款基于 AI 原生的产品。吃瓜观众不禁感叹，腾讯怎么慢下来了？

然而，腾讯在投资大模型上似乎并没有任何减速，甚至做到了扫货式投资。5月20日，月之暗面被曝出正与投资者洽谈融资事宜，投资前的估值为 30 亿美元，投资方正是腾讯。在此之前，腾讯已经投资了智谱AI、百川智能、Minimax和深言科技。

自研产品上，腾讯日前“虽迟但到”，终于开始大力宣传其新产品腾讯元宝和腾讯元器。本文梳理了腾讯AI团队架构和发展沿革，以及腾讯在AI大模型和产品上的布局。Enjoy！

腾讯AI团队和团队布局，根据公开信息整理

丨腾讯AI团队架构

2016年，腾讯集团开始着手实施其人工智能战略，并成立了腾讯人工智能实验室（AI Lab），致力于全球范围内招募顶尖的科学家。这个实验室隶属于腾讯的技术工程事业群（TEG），其研究重点包括计算机视觉、语音识别、自然语言处理和机器学习等基础领域，同时也探索在内容、社交和游戏等方向的应用。

进入2017年，腾讯提出了一个由三个层次构成的AI战略架构：基础研究、场景共建和能力开放。在这个架构下，腾讯AI Lab和新成立的机器人实验室RoboticsX成为”AI+机器人”的两个基础部门，它们共同致力于连接虚拟世界与现实世界，并致力于实现通用人工智能（AGI）的目标。

到了2018年，腾讯的人工智能和前沿科技实验室矩阵正式形成，AI研究的重点转向了更高层次的多模态研究和通用人工智能。腾讯的AI实验室矩阵包括AI Lab、腾讯优图实验室以及微信事业群下的AI团队，这标志着腾讯AI核心研发体系的确立。同时，腾讯宣布了其历史上的第三次重大架构调整，将原本分散在不同部门的商业化团队合并为”广告营销服务线”。这一举措为混元大模型的诞生奠定了基础。

2022年4月，腾讯首次公开了其”混元”大模型的研发情况。2023年2月，腾讯宣布成立”混元助手”项目组，针对类似ChatGPT的对话式产品进行研发。该项目组由张正友领导，俞栋、王迪、刘田担任项目经理，目前至少有7位组长和7位赞助商参与。

2023年9月，在腾讯全球数字生态大会上，腾讯的混元大模型正式亮相，并通过腾讯云向外界开放。

值得注意的事，腾讯AI的组织架构与字节有明显的不同。腾讯的组织模式以模型和技术为核心而非以产品为核心。不仅如此，腾讯的组织结构更为复杂和不透明，光是AI相关研究院的数量就颇多。混元大模型的开发也是抽调了各个业务线的团队组织在一起。

腾讯AI团队组织架构，根据公开信息整理

腾讯 AI Lab

腾讯 AI Lab 是腾讯公司旗下的人工智能实验室，成立于 2016 年。作为腾讯在人工智能领域的重要布局之一，该实验室旨在推动人工智能技术的发展，探索其在各个领域的应用，为全球用户提供更加智能、便捷的服务。AI Lab 隶属于技术工程事业群 (TEG)，专注于包括计算机视觉、语音识别、自然语言处理和机器学习方向的基础研究，和内容、社交、游戏等方向的应用探索。

AI Lab 官网：https://ai.tencent.com/ailab/

腾讯 AI Lab 的定位是：

腾讯人工智能技术的研发中心
世界一流的人工智能研究机构
人工智能人才的聚集地

腾讯优图

腾讯优图实验室成立于 2012 年，是腾讯公司旗下顶级人工智能实验室。优图聚焦计算机视觉，专注人脸识别、图像识别、OCR等领域开展技术研发和行业落地。

2017 年之后，伴随着腾讯开源策略及 AI 开放平台的推进，优图实验室输出其多年的 AI 积累和产品能力，并与腾讯 AI Lab、腾讯云等深度融合，打造了一系列人工智能产品，在提升腾讯云 AI 产品矩阵的同时，挖掘客户痛点、切实为行业降本增效。

腾讯优图官网：https://open.youtu.qq.com/

腾讯优图实验室的主要研究领域集中在计算机视觉和深度学习技术：

图像识别：利用深度学习技术进行图像内容的识别和分类。
人脸检测与识别：研究和开发用于人脸检测、人脸核身、以及人脸表情识别的算法。
活体检测：开发用于区分真实人脸和伪造人脸的技术，提高安全性。
多模态学习：探索结合图像、文本、声音等多种数据模态的学习和识别技术。
工业异常检测：针对工业应用场景，开发用于检测产品缺陷和异常的AI解决方案。
动态表情识别：研究动态视频中的表情变化，用于情感分析和交互体验改进。

微信AI

微信AI部门致力于为语音识别、自然语言处理、计算机视觉、数据挖掘和机器学习等人工智能技术的发展带来革命性进步。

微信AI官网：https://ai.weixin.qq.com/

微信AI研究的几个关键领域包括：

语音与音频：微信AI的语音与音频研究致力于提供最准确的语音识别技术服务，使用户与机器的交流尽可能自然和便捷。
自然语言处理：该领域的研究旨在让机器模仿人类的“思考”方式，理解用户的指令，并提供所需的信息。
图像与视频：图像与视频研究利用文本识别、面部识别、内容理解和增强现实技术，让机器通过视觉感知世界。
数据挖掘与文本理解：依托微信平台的海量优质内容，研究集中在主题聚类分析、信息分类、非结构化知识提取、文本理解和热点跟踪技术。
分布式机器学习平台：Amber是一个分布式计算平台，提供一套API和库，用于支持微信AI在机器学习和深度学习领域的研究。

丨腾讯AI产品和应用

腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生强调，腾讯的大模型发展策略聚焦于”产业实用”。打造大模型只是开始，关键在于将技术应用到产业场景中，创造实际价值。

因此，相较于开发新产品，腾讯更注重将大模型技术融入现有业务和产品中。目前，混元大模型已在600多个腾讯内部业务和场景中进行了测试和应用。比如微信读书基于混元大模型，推出了AI问书等新功能，有效提升了用户的阅读效率和体验。腾讯会议推出AI小助手，即时回答会议中的问题，显著提高了会议效率。

就腾讯混元的原生产品来说，腾讯元器和腾讯元宝刚刚上线，未来表现还有待观察。元器和元宝是否能打败扣子和豆包，让我们拭目以待。

模型层

大语言模型：腾讯混元大模型

混元大模型 (Hunyuan) 是由腾讯自研的大语言模型，具有强大的中文创作能力、复杂语境下的逻辑推理能力和可靠的任务执行能力。

产品网站：https://hunyuan.tencent.com/

该模型基于大量的文本等数据进行训练，覆盖了多个核心优势能力：

多轮对话：具备上下文理解和长文记忆能力，流畅完成各专业领域的多轮问答
内容创作：支持文学创作、文本摘要、角色扮演能力，流畅、规范、中立、客观
逻辑推理：准确理解用户意图，基于输入数据或信息进行推理、分析
知识增强：有效解决事实性、时效性问题，提升内容生成效果
多模态：支持文字生成图像能力，输入指令即可将奇思妙想变成图画

腾讯混元介最大模型已拓展至万亿级参数规模，并在 1B、3B、7B、13B 等不同参数量下，均有布局。在腾讯云上，混元大模型也提供了万亿参数 hunyuan-pro、千亿参数 hunyuan-standard、百亿参数 hunyuan-lite 等多种尺寸的模型服务，目前已面向企业及个人开发者全量开放。

其中，hunyuan-standard 最新上线了支持 256k 超长上下文窗口的长文模型，具备单次处理超过 38 万字符的超长文本能力。升级后的腾讯混元，采用混合专家模型 (MoE) 结构，模型总体性能相比上一代提升了 50%，部分中文能力已追平 GPT-4，在处理「时新」问题的表现上，包括数学、推理等方面的能力也有显著提升。多种尺寸的腾讯混元 MoE 模型也即将对外开源，可适用于手机端、PC 端、云/数据中心等不同的部署场景。

在图像生成领域，腾讯的混元文生图基础架构已经升级到与Sora相同的DiT架构，支持中英文输入和理解，并具备多轮绘图能力，同时已对外开源。

在视频生成领域，腾讯混元支持多种视频生成能力，包括文生视频、图生视频、图文生视频和视频生视频。目前，已实现16秒视频生成，并预计在第三季度达到30秒视频生成。目前混元尚未向C端用户开放视频生成功能。

在3D生成方面，腾讯混元已经布局了文/图生3D技术，仅需30秒即可从单张图片生成3D模型。

AI平台：腾讯AI开放平台

腾讯 AI 开放平台汇聚了腾讯内部的顶尖技术、专业人才和行业资源，致力于提供一站式 AI 服务。它依托腾讯 AI Lab、腾讯云、优图实验室及合作伙伴的技术能力，为 AI 技术及产品找到更多的应用场景。

目前，平台提供了多种 AI 解决方案，包括人脸核身、语音识别、AI绘画等，覆盖了众多应用场景。此外，平台还为创业项目提供了全方位的支持，包括技术支持、市场推广、投资对接等，帮助创业者实现快速发展。

平台官网：https://ai.qq.com/

主要特点和功能包括：

大模型知识引擎产品：腾讯云提供大模型知识引擎产品，为新老客户提供50万token的免费赠送，以回馈客户。
泛娱乐行业场景专区：平台针对音视频互动、娱乐直播、游戏行业等业务痛点和场景，提供相应的爆款产品和产品组合。
腾讯云慧眼人脸核身服务：提供领先、全面、安全的用户身份信息真实性核验服务，满足多样化的身份认证需求，价格限时2折起。
AIGC创意营销解决方案：利用腾讯自研的大模型引擎，提供创新多样的AI玩法，帮助企业构建年轻化、数字化的品牌形象，提高用户活跃度和留存转化率。
面向丰富业务场景的AI解决方案：提供多种AI解决方案，如智能票据识别，支持多种票据的识别，大幅提升信息处理效率。
开发者实践专区：为开发者提供视频教学、课堂专区、问答社区等资源，帮助他们更好地实践和应用AI技术。

Bot 开发平台：腾讯元器

腾讯元器是腾讯公司推出的一款基于其腾讯混元大模型的AI智能体创作与分发平台，对标字节的扣子。它允许用户轻松创建和部署智能体，无需编写代码即可实现聊天对话、内容创作、图像生成等功能的开发和接入。腾讯元器提供丰富的预集成插件和知识库资源，大幅降低了智能体的开发门槛，使企业和开发者能够快速构建并使用智能体。

产品主页：https://yuanqi.tencent.com/

主要特点和功能包括：

创建智能体：用户可以设置智能体的名称、简介、头像、详细设定、开场白和预置引导问题，这些都可以基于名称和简介由AI生成。
插件功能：添加插件可以让智能体调用外部API，例如网页搜索、文档解读、生成图片等。
知识库：智能体可以根据知识库内容回答用户问题，支持将文件直接上传到平台中进行知识库创建。
工作流：通过可视化的方式，对插件、大语言模型、代码块等功能进行组合，实现复杂、稳定的业务流程编排。
发布智能体：选择公开范围和发布平台，完成智能体发布。
使用智能体：智能体发布审核后，即可在腾讯元器和相应的发布平台进行体验使用。

腾讯元器支持一键分发到腾讯的全域渠道如QQ、微信客服等，为用户提供便捷的智能体应用体验。

应用层

AI 对话平台：腾讯元宝

腾讯元宝是一款基于腾讯混元大模型的智能助手 APP，旨在为用户提供便捷、智能的生活服务，对标字节的豆包。腾讯元宝可以帮助用户管理日程、设置提醒、查询天气、预订酒店等，同时还具备语音识别和语音合成能力，让用户可以通过语音与腾讯元宝进行交流。

此外，腾讯元宝还可以与其他腾讯应用进行集成，为用户提供更加丰富的服务体验。腾讯元宝的发布日期是2024年5月30日，并且已经在多个应用商店上架，包括应用宝、小米、华为、vivo、OPPO以及苹果App Store等.

产品主页：https://yuanbao.tencent.com/chat

腾讯元宝的核心功能包括：

AI搜索：提供参考多个信息来源并总结的搜索服务，使信息获取更加准确和可靠。
文档总结：支持多格式多文档的总结，帮助用户快速获取文档要点。
超能翻译官：提供直译和意译服务，用户可以提供论文链接，App会给出翻译。
口语陪练：提供口语对话练习，并对用户的语法与发音进行评价。

此外，腾讯元宝还依托于腾讯的生态优势，在AI搜索方面接入了微信搜一搜、搜狗搜索等搜索引擎，并通过AI搜索增强，提升了时新类和知识类问题的效果，使得搜索更加高效，同时内容覆盖了微信公众号等腾讯生态内容及互联网权威信源，提高了答案的准确性。

实际测试中，元宝APP虽然推出了许多新功能，但实际上更像是腾讯混元小程序的一个增强版本。在使用体验方面，元宝暂时还无法与豆包相媲美。

而元宝的AI搜索功能中，其数据来源涵盖了微信搜一搜、搜狗、腾讯新闻、腾讯云开发社区等多个平台，这是腾讯体系的绝对优势。然而，元宝目前还无法访问知乎、小红书、今日头条、抖音等其他主要平台的内容。

AI 写作：Effidit

智能创作助手 Effidit (Efficient and Intelligent Editing) 是腾讯 AI Lab 推出的一个研究性原型系统，旨在探索利用AI技术提升写作者的写作效率和创作体验。

产品网站：https://effidit.qq.com/

Effidit 支持中英两种语言的输入，提供了一系列功能：

多维度文本补全：提供短语补全、检索式句子补全和AI自动续写三种方式，帮助写作者启发思路和提高写作效率。
多样化文本润色：包括短语润色、句子改写和句子扩写三种方式，辅助用户提升文本表达质量。
例句推荐：基于用户输入的关键词，通过网络搜索和AI生成两种形式，为用户提供例句参考。
文本纠错：实时提供文本校对服务，支持识别删除类、插入类和替换类（错别字）等类型错误，并提供纠错建议。
云输入法：提供中英两种语言的云输入法，依托于云端的大规模语言模型，提供丰富的输入提示信息，提升用户输入效率。

此外，Effidit 还推出了专门针对学术写作用户的 “文涌·学术版”，增加了跨语言例句检索和语义增强的论文检索等功能。Effidit 的特色在于其多维度的文本补全能力和多样化的文本润色结果，以及全方位的辅助写作能力，旨在通过人机协作的方式降低内容出错的风险，提升写作者的创作体验。

AI 图片修改：ARC

ARC图片增强是一款由腾讯AI产品提供的图像处理工具，包括人像修复、人像抠图、动漫增强等，可有效提升图片的品质和美观度，可用于修复老照片或者照片去背景等场景。

产品网站：https://arc.tencent.com/zh/ai-demos/faceRestoration

产品的特点和功能：

人像修复：能够将模糊的照片一键变清晰，效果自然。但对严重缺失和人像残缺的老旧照片可能无法有效处理。
人像抠图：为设计工作者提供了便捷的抠图功能，可以快速从背景中分离出人物，并且能够较好地处理发丝等细节部分。
动漫增强：专门针对动漫图片的修复和增强，使修复后的细节更加深入。

AI 视频生成：腾讯智影

腾讯智影是腾讯推出的在线智能视频创作平台，它融合了多种 AIGC 能力，旨在简化视频创作过程，使得用户只需使用一个工具就能完成智能视频的创作，提供了包括智能视频剪辑、特效处理、音频配乐等在内的多种智能创作功能，帮助用户高效地制作出高质量的视频内容。

产品网站：https://zenvideo.qq.com/

主要特点功能包括：

智能剪辑：利用AI算法自动识别和剪辑视频素材，快速生成精彩的视频片段。
特效处理：提供丰富的视频特效和滤镜，用户可以通过简单的拖拽和点击就能为视频添加视觉效果。
音频配乐：智能匹配音乐和音效，根据视频内容自动调整音量，增强视频的情感表达。
一键生成：用户可以通过简单的操作，一键生成具有专业感的视频作品。

AI 图片生成：腾讯云智绘

腾讯云智绘 (AI Design Creative) 是腾讯推出的一款面向个人创作者和中小型企业的素材智能化设计生产平台。它提供在线工具，帮助用户创建各类形态的素材，适用于各行业的新媒体运营等场景。

产品网站：https://zhihui.qq.com/

主要功能和特点如下：

丰富的素材类型：支持创建图文、海报、表单、H5、长页、名片等多种类型的素材，满足用户在不同场景下的设计需求。
智能设计：利用AI技术，为用户提供了智能布局、智能配色、智能字体等设计功能，帮助用户快速生成高质量的素材。
个性化定制：支持用户自定义素材的尺寸、颜色、字体等参数，满足个性化设计需求。
高效生产：提供秒速海量的生产服务，帮助用户快速生成大量素材，提高工作效率。
稳定可靠的输出品质：腾讯云智绘保证输出素材的品质，确保用户在各种场景下使用的素材都具有较高的质量。
创意素材库：提供丰富优质的创意素材库，帮助用户快速找到合适的素材，提高设计效率。

腾讯云智绘为企业提供深度定制接口，提供丰富优质的创意素材，实现秒速海量的生产服务，保证稳定可靠的输出品质，旨在帮助用户和企业实现增效降本的目标。

AI 医学服务：腾讯觅影

腾讯觅影是腾讯公司推出的专注于医疗健康领域的人工智能平台。它通过结合先进的AI技术和医疗专业知识，旨在提升医疗服务的质量和效率。

产品网站：https://tencentmiying.com/official/

关键特点和产品：

肺炎智能评估系统：基于AI技术对肺部CT影像数据进行智能化处理，为肺炎的分析提供依据和建议。
智能导诊：基于医疗AI和自然语言处理技术，以智能导诊为核心的产品。
智能预问诊：智能理解患者主诉，智能追问生成电子病历，了解患者病情，提高效率。
AI临床助手：基于先进技术，依据客观权威的知识来源，协助提升医疗服务效率。
AI精准预约：基于患者病情，提供医患精准匹配的AI智能判病引擎能力。
AI就医助手：针对医疗场景需求打造的智能对话机器人。

AI 交互翻译：transmart

腾讯交互翻译TranSmart是腾讯公司推出的一款翻译产品，由腾讯AI Lab负责研发。腾讯交互翻译融合了腾讯人工智能实验室自研的交互式机器翻译、神经网络机器翻译、统计机器翻译、语义理解、信息检索等技术，帮助用户更快、更好地完成翻译任务。

产品网站：https://transmart.qq.com/zh-CN/index

关键特点和产品：

交互式机器翻译：业内首个交互式机器翻译落地产品，提供译文片段智能推荐和整句补全，错误的机翻结果无需重复多次进行人工修订。
翻译记忆融合：动态结合用户已完成的双语句对，生成更符合期望的自动译文，性能显著优于传统静态和增量式训练的机器翻译。
翻译输入法：参照原文上下文和机器翻译知识，实现精准组词，加快人工翻译过程中的输入效率，比普通输入法显著减少按键数与打字时间。

AI 翻译：腾讯翻译君

腾讯翻译君是一款在线翻译工具，它基于腾讯 AI Lab 的先进技术，提供了实时会话翻译服务，支持多种语言之间的互译。这款产品特别适用于需要跨语言沟通的场合，如境外旅游、国际交流、商务会议等。

产品网站：https://fanyi.qq.com/

腾讯翻译君的主要特点如下：

多语言支持：支持包括中文、英语、日语、韩语、法语、西班牙语、意大利语、德语、土耳其语、俄语、葡萄牙语、越南语、印尼语、泰语、马来西亚语、阿拉伯语、印地语等在内的多种语言的互译。
神经网络机器翻译：采用先进的神经网络机器翻译技术，生成更加准确、流畅的译文。
统计机器翻译：结合统计机器翻译技术，提高翻译结果的准确性和可靠性。
语义理解：通过对原文进行深入分析，理解文本的语义和语境，从而生成更符合原文意义的译文。
功能丰富：除了基本的翻译功能外，腾讯翻译君还提供文本校对、朗读、复制到剪贴板等功能。

AI 虚拟人：未伴（国内已下架）

“未伴”是一个集AI陪聊、AI伴侣写真等多功能于一体的AI聊天产品，与传统的社交App不同，“未伴”中的聊天对象均为AI伴侣，可实现人机社交的全新玩法。而且在AI伴侣的选择上，用户既可以选择预制或其他用户创建的AI伴侣，也根据自身要求创建新的AI伴侣，且每个用户可创建的AI伴侣数量不设上限，创作好的AI伴侣会存放于好友列表中。

5月27号，未伴宣布逐步停止创建、搜索、聊天及朋友圈功能，并在下个月14日正式停止在中国大陆地区的服务，团队的重心也将集中在非大陆地区的迭代运营上，发力出海。

基于现有产品的 AI 功能

微信读书：AI 问书

微信读书的AI问书功能是一项集成在微信读书应用程序中的创新服务，它利用腾讯混元大模型的先进技术，为用户提供智能化的书籍内容查询和问答体验。

关键特点和产品：

回答问题：用户可以直接在微信读书应用的搜索框中输入问题，并选择AI问书功能。系统会根据用户的问题，从书籍中提取相关信息，生成答案回复用户。
解释概念：当用户在阅读时遇到不理解的名词或概念，可以选中文本并使用AI问书功能，系统将提供该名词或概念的解释。
引用书籍资料：AI问书在生成答案的同时，会提供引用的书籍资料列表。用户可以点击这些引用，直接跳转到书籍或资料中的具体片段。
内部闭环：AI问书功能实现了微信读书应用内的闭环操作，用户无需离开应用即可获取信息，这提高了阅读的连贯性和效率。

微信：腾讯小微

腾讯小微是基于微信AI团队智能对话系统打造的智能语音助手解决方案。接入腾讯小微的设备不仅可以通过自然语言交互来使用音乐、视频、社交、天气、智能家居等技能，还能通过腾讯小微技能平台自定义配置硬件私有化技能。

产品主页：https://xiaowei.weixin.qq.com/

关键特点和产品：

语音交互：用户可以通过语音命令与腾讯小微进行交互，获取信息或执行任务。
智能助手：腾讯小微可以作为个人助理，帮助用户完成日常任务，如设置提醒、查询天气、播放音乐等。
内容服务：腾讯小微提供了丰富的内容服务，包括新闻、故事、笑话等，用户可以通过语音命令获取这些内容。
智能家居控制：腾讯小微可以连接和控制智能家居设备，实现家居自动化。
多平台支持：腾讯小微可能支持多种设备和平台，包括智能手机、智能音箱等。

微信：小微助手

腾讯小微助手是腾讯公司推出的一款智能语音助手，它通过语音交互技术为用户提供便捷的服务和信息获取方式。

关键特点和产品：

对话式检索：用户可以通过点击系统托盘中的图标唤起搜索框，使用关键字搜索本机上的应用，或者通过自然语言文本检索信息或服务。
剪贴板管理：小微助手能够管理文本、图片、文件等形态的内容，并可以按使用场景对剪贴板进行区分管理。
小微圈子：这是一个用户与好友或组织成员之间共建的共享空间，允许在多人之间共享数据或内容。管理员可以分享应用、网页、问答数据，配置对话服务。

微信：微信对话开放平台

“对话即服务”的平台，开放了微信在对话领域积累多年的的智能对话技术，使得开发者及非开发者可简单、快速地搭建智能对话机器人（智能客服），并接入公众号、小程序等，为业务赋能，降本增效。

关键特点和产品：

微信官方生态：唯一由微信官方授权，可接入企业微信，公众号，小程序进行用户服务的智能机器人平台；全面覆盖了完整的微信生态，包括公众号、小程序、视频号、微信客服、企业微信，更有网页、开放接口，使得一次开发能解决所有场景。
使用成本低：低门槛、零代码实现机器人开发，扫码即可完成服务接入，通过平台的预置技能和对话策略，智能数据预测、智能数据挖掘，能够实现对话机器人的快速上线；即使完全 0 基础无开发能力的用户，5 分钟简单设置问答后，即可零基础搭建智能客服平台接入微信生态，并设置问答型（简单问答）或任务型（高级技能）智能对话技能；

腾讯云Paas产品

基于产业对模型的多模态能力需求以及性价比与效率要求，腾讯云在这次峰会上推出三款 PaaS 产品——「大模型知识引擎」、「大模型图像创作引擎」和「大模型视频创作引擎」，通过 PaaS 服务简化数据接入、模型精调、应用开发流程，助力企业更高效、简单地用大模型开发 AI 原生应用，快速接入生产场景。

混元大模型图像创作引擎

腾讯混元大模型图像创作引擎是一款基于大模型的图像生成与编辑 API 服务。它结合了输入的文本或图片，智能地创作出与之相关的图像内容。这款引擎具有强大的中文理解能力、多样化的风格选择，以及更好的中文场景支持。

产品主页：https://cloud.tencent.com/product/aiart

目前创作引擎能够支持以下功能：

建筑风景生成：根据输入的文本描述，生成具有特定建筑风格和景观的图像。
古诗词理解：结合古诗词的内容，生成与之意境相符的图像。
水墨剪纸风格生成：模仿中国传统的水墨剪纸艺术，创作出具有独特韵味的图像。
高精度图像生成：根据输入的文本或图片，生成具有动漫或游戏风格的精美图像。
风格转换：将输入的图像转换成指定的艺术风格。

适用的场景包括：

内容创作：为设计师、艺术家和内容创作者提供一个新的创作工具，帮助他们快速实现创意和想法。
内容运营：为媒体、广告和营销行业提供高质量的图像资源，提升内容的吸引力和传播效果。
文化传承：通过生成具有中国传统元素的图像，支持和推广中国文化遗产的传播和教育。

大模型图像创作引擎为内容创作者和内容运营商提供了高效、便捷的技术支持，有助于提升内容的质量和吸引力。通过使用这款引擎，用户可以轻松地创作出符合自己需求的图像内容，从而在各种应用场景中实现更好的视觉效果和传播效果。

混元大模型视频创作引擎

腾讯混元大模型视频创作引擎是一款基于大模型的视频创作工具，提供了视频生成、视频翻译和人脸融合三大核心功能。该引擎采用了腾讯先进的 AIGC 大模型等，以提供高效、智能的视频创作体验。

产品主页：https://cloud.tencent.com/product/segmentportrait

目前该引擎能够支持以下功能：

视频生成：可以根据用户输入的文本描述或图片，自动生成与之相关的视频内容。这个过程包括场景构建、角色生成、动作设计等多个环节，最终生成一个完整的视频。
视频翻译：支持将一种语言的视频自动翻译成另一种语言，同时保持视频的语音、字幕和画面的一致性。这对于跨语言沟通和国际合作非常有用。
人脸融合：可以将用户上传的人脸照片与指定的视频角色进行融合，生成一张新的脸部图像。这个功能可以用于各种娱乐、广告和社交媒体应用。

主要适用场景包括：

泛娱乐：在社交媒体、短视频平台等泛娱乐领域，提供个性化和创新的视频内容制作工具。
广告行业：帮助广告创作者制作更具吸引力和创意的广告视频，提高广告的传播效果。
教育领域：为在线教育平台提供丰富的视频教学资源，增强学习体验。
金融服务：在金融行业，可以用于制作解释性视频，帮助用户更好地理解金融产品和服务。

腾讯混元大模型视频创作引擎的产品形态包括 API 和 SDK，方便开发者集成和使用。它广泛服务于视频创作领域的各个行业和场景，通过使用这款引擎，用户可以轻松地创作出高质量的视频内容，提高工作效率和创造力。

AI 问答：大模型知识引擎

大模型知识引擎是面向企业客户及合作伙伴的，基于大语言模型的知识应用构建平台，结合企业专属数据，提供知识问答、知识总结等应用范式，更快更高效地完成大模型应用的构建，推动大语言模型在企业服务场景的应用落地。

产品主页：https://cloud.tencent.com/document/product/1759/104194

目前该引擎的优点包括：

高效搭建大模型应用：提供大模型应用构建工作台，同时提供公有云和私有化两个版本，满足您高效搭建大模型知识应用的需求。
复杂知识处理能力强，知识问答可靠性高：使用 OCR、LLM+RAG 、MLLM 等多种技术能力，擅长处理企业级多模态复杂知识问答。
配套工具链完善：开放模型配置、知识配置等配套工具链，提供最小的必要输入即可获得良好的效果，支持测试 – 修正 – 发布 – 反馈增强的一站式流程。

来源：

[1] 腾讯小微，https://xiaowei.weixin.qq.com/

[2] 小微助手，https://xiaowei.weixin.qq.com/next

[3] 微信对话开放平台，https://chatbot.weixin.qq.com/

[4] 腾讯云产品介绍文档，https://cloud.tencent.com/document/product/

[5] 腾讯 Tencent AI 全景解析，https://mp.weixin.qq.com/s/XuB4wRwEh1rtC0ySv14xBw

[6] 不要小看「实而不华」的腾讯 AI，https://mp.weixin.qq.com/s/T6iYl7hWPveF9OxbChXAxA

[7] 揭秘腾讯大模型新项目组“混元助手”人才地图，

https://finance.sina.cn/tech/2023-02-27/detail-imyicmyz2049229.d.html

原文：https://mp.weixin.qq.com/s/LyVaTr_DbMnupV_IIuMR0A

- Posted in: AI

- Tags: 复盘 , 大模型

0 条评论，1,706 次阅读

发表回复取消回复

既然来了，说些什么？

My Secret Rainbow