
SERVICE PHONE
363050.com发布时间:2025-06-25 15:28:36 点击量:
爱游戏,爱游戏体育,爱游戏平台,爱游戏娱乐,爱游戏官网,爱游戏官方网站,ayx爱游戏平台,爱游戏app,爱游戏体育app,爱游戏app下载,爱游戏体育官网,爱游戏体育app下载,爱游戏体育网页版
今年 618 大促期间,「交个朋友」在百度优选搞了场直播,不过这场直播的主角不是人,而是 AI。直播间里,罗永浩和朱萧木两个数字人配合默契,不抢话、不抬杠,只是一味地带货、爆梗、讲段子,还时不时跟评论区网友来个互动。
「弹幕上问我怎么辨别茅台真假,简单喝一口,心疼就是真的,肝疼就是假的。」
「有人问方便面好不好吃,买回去尝尝,好吃就分给朋友一点,不好吃就全分给朋友。」
这逼真效果,就连老罗本人看了都吓一跳:「他们在那儿眉来眼去,讲着跟我一样风格的段子,有点恍惚……」
更离谱的是,罗永浩数字人的直播「战绩」比真人还能打,整场直播吸引了超 1300 万人次观看,GMV 突破 5500 万元,部分核心品类带货量、用户平均观看直播时长均反超罗永浩本人在百度电商的直播首秀。
如此以假乱真的数字人到底是怎么做出来的?据老罗在微博上「自曝」,这用的是百度的多模协同数字人技术
传统数字人生成技术常面临语音、语言、视觉多模态割裂的问题,具体表现为台词与语音语调不同步、表情手势与语义错位等,而百度的技术突破在于引入剧本驱动的多模协同。
具体来说,这套技术方案包含了剧本驱动的数字人多模协同、融合多模规划与深度思考的剧本生成、动态决策的实时交互、文本自控的语音合成、高一致性超拟真数字人长视频生成等五大创新技术,使数字人的「神、形、音、容、话」达到高度统一,最终呈现出一个具备高表现力、内容吸引人、人-物-场可自由交互的超拟真数字人。
在百度这套多模协同数字人技术方案中,剧本生成无疑是核心环节,涵盖台词、多模驱动和动态交互三部分。
最核心的台词需要解决三大关键问题。其一,通过风格建模为不同风格提供精细化定制,使台词呈现多样化风格,并与主播的个性高度契合;其二,通过人设建模、人物性格与行为逻辑的精准还原,以及在双人直播场景中保持多角色协同,塑造拟真化人设;其三,引入内容规划和深度思考机制,在保证讲品信息准确、富有说服力的同时增强吸引力,同时为避免「幻觉」,还在台词生成中融入事实校对和知识增强机制,保证每一句话都经得起推敲。
就以罗永浩数字人为例,罗永浩和朱萧木都具有强烈的个人风格,直播时经常会蹦出几句口头禅,为打造可控性强、极具真实感的虚拟主播,百度基于文心大模型 4.5 Turbo,投入海量真人直播数据,依托「转录挖掘、优质提炼、仿写合成与自动评估」四个环节不断优化训练语料,使模型深度吸收两位主播的语言特点与思维习惯,并在迭代学习中持续逼近更契合的输出效果。同时引入多角色协同机制,对不同主播的表达逻辑进行建模,使对话在语义推进、节奏控制和风格调性上保持协调一致,避免「各说各话」的割裂感。
所谓多模驱动,是指大语言模型基于任务目标与主播人设生成基础台词,并同步输出视觉与语音的多维标签。这些标签不仅是对语言内容的补充,更是驱动音视频生成系统实现自然、同步、富表现力输出的关键指令。比如,在语音合成阶段,模型利用剧本中的段间标签精细控制不同语段之间语调衔接,同时文本内容也能驱动 TTS 系统实现更细粒度的语调调控。音频合成结果再进一步与视觉标签联动,使视频生成系统能够实现唇动同步、高表现力的动作设计和情绪表达,从而在输出层实现「声、形、意」三模态的统一。
在此基础上,剧本生成还具备动态交互能力。比如 AI 老罗在卖纯牛奶时,有网友问 360 个月的宝宝能不能喝,AI 老罗便以「我 600 个月都能喝,谁还不是个宝宝呢」进行幽默回应,这种回应背后不仅是语言生成,更是基于人设风格、场景上下文、情绪基调等多模信息的综合决策。
在数字人技术逐渐渗透直播、电商、客服等互动场景的过程中,语音合成的自然度正成为决定用户沉浸感与信任度的关键因素。特别是在直播间,观众希望听到的不是生硬的朗诵或机械音,而是一种如同真人主播般富有情绪、节奏自然、具备沟通张力的表达方式。因此,数字人语音的「人味儿」越足,交互的真实感就越强,用户的接受度和互动意愿也随之提高。
然而,传统的语音合成技术往往呈现出字正腔圆但缺乏情感的表达风格,在充满情绪张力的直播场景中,这种过于规整的声音反而显得「出戏」。它无法像人类主播一样,适时展现语调的抑扬顿挫、节奏的快慢变化,也很难根据商品介绍、互动节奏等变化调整情绪状态,尤其是在呼吁用户下单、介绍爆款产品这类关键话术环节,传统 TTS 无法自然表达出情绪递进和感染力,进而影响整个数字人系统的说服力与亲和力。
针对这些现实痛点,百度提出了「文本自控的语音合成」方案,在大语言模型输出剧本之后,负责语音合成的大模型会结合文本内容、主播风格特点,以及对于细粒度韵律特征表示进行统一处理,这一过程中语音模型不仅知道「要说什么」,更知道「要怎么说」,从而在生成语音时自然带出情绪波动与语言节奏,使得语音在内容和表达方式上都更贴近真实人类。
例如,在罗永浩数字人直播间中,主播语音高度还原本尊的音色和语调,甚至在直播节奏中展现出自然的停顿、强调和情绪变化。同时,百度还解决了直播中双人互动的挑战。现实中,主播之间的配合往往包括打断、附和、重复等高频行为,这对语音合成提出了连贯性和互动性的更高要求。为此,百度引入了「对话上下文编码器」,将历史对话与当前对话的信息进行语音合成时的统一推理计算,以此实现「双人配合」的自然过渡。
在数字人直播场景中,形象生成与驱动是当前技术难度最高的环节。首先必须解决多模协同的问题,它涉及多向的信息对齐:剧本对视频表达提出具体要求,TTS 语音又对视频节奏与动作生成形成约束,反过来视频本身还需对语音进行校准,最终需要实现「音、容、话」三者的一致性。
其次,主播在直播中往往伴随着大量手势、动作和表情等「高表现力动作」,它们对于强化用户情绪感染力具有显著作用,因此在视频生成阶段,不仅要忠实复现语言内容,还需对这些高表现力动作进行准确建模与流畅合成。
在场景交互层面,数字人直播还面临「人-物-场」自由交互的复杂性。主播需要与商品、背景和空间布局进行符合物理逻辑的互动,例如望向商品、举起物品或指向展示区等。若缺乏对空间关系的精准理解,极易出现穿模、错位等破坏沉浸感的瑕疵。
此外,直播时长也放大了技术一致性的难题。一场超 6 小时的直播,任何人物形象的波动、商品定位的误差以及动作风格的不一致都会直接拉低观众体验。
为此,百度提出了「高一致性超拟真数字人长视频生成」技术方案,将历史视频数据、剧本脚本、语音信息以及骨骼驱动等多模态信号作为输入,经过多模态视频分析与理解,分别生成具有高表现力的片段、复杂人 - 物 - 场交互片段以及大动作大表情片段,并在长时序上进行统一调度,从而保证语音、口型、表情与动作始终保持高度同步,实现真正的「音、容、话一致」。
在罗永浩数字人直播项目中,这一技术方案得到了集中体现。罗永浩与朱萧木均具强 IP 属性,二者的形象、语言风格、互动节奏都需得到高度还原。同时,整场直播中所涉及的商品种类繁多,体积、位置、用途各异,对人 - 物交互的精度和响应速度提出了更高要求。百度对人物 ID 与商品 ID 进行了独立建模与保持,使得系统能够在长时间内容中持续稳定地控制人物表现与商品指向,避免风格漂移与交互误差,最终实现主播间自然流畅的配合,语言节奏、动作执行和商品展示高度统一的效果。
早在十四年前,移动互联网正值爆发期,「人工智能」仍是实验室里的晦涩概念,百度就把资源投向了一个看不见回报的领域,这一选择在当时显得颇为超前甚至「另类」。
时间给出了答案。ChatGPT 的横空出世掀起生成式 AI 浪潮,百度紧跟每一个关键节点,连续发布重磅大模型成果:从文心 3.0 到文心大模型 4.5,再到融入深度思考能力的 X1 以及升级版 4.5 Turbo,技术体系不断进化,模型的认知深度和生成能力日益增强。
此次罗永浩数字人带货直播,正是文心大模型的一次「最佳实践」。它不仅彰显了百度技术的成熟与前沿,更验证了大模型技术在真实商业场景中的高效与可行。
可以预见,随着深度思考、知识增强、意图理解与多角色交互等关键能力持续跃升,百度的数字人将愈发拟真与智能。这带来的不仅是效率提升,更意味着技术投入带来的商业模式的「无人区」探索和价值重构。
改革与创新是教育事业发展的不竭动力,根据国家《中长期教育改革发展纲要》和教育规划,国家高度重视云南教育的改革与发展,决定把云南纳入全国教育体制改革试点的六个省份之一。省委、省政府高度重视此次教育体制改革,于20xx年10月10日召开了“云南省教育体制改革电视电话会议”,主要改革内容①深化人事制度改革,提高边远山区教师待遇,加大绩效工资的奖惩力度;②实行中小学教师职称合并,只设五个等级,正高、副高、一、二、三级;③大力发展学前教育和职业教育;④促进公平,优化教育资源配置;⑤加大对教育的投入,教育经费必须持续增长;⑥积极构建现代教育管理的新体制,创建规范管理的新体系,形成各自不同的办学风格和特色;⑦建立人才培养的新模式,激发教育发展的新活力;总结起来就是六个新(即:新体系,新模式,新体制,新格局,新高度)。根据我乡教育实际,我们面临着千载难逢的新机遇,新挑战,既感使命光荣,有感责任重大,既可喜可贺,又可感可忧。因此,我们必须清醒地认识到当前仍至长期一段时间制约永兴小学教育发展的瓶颈仍然是优秀教师的优质教育。所以我们一定要尽快提高教师的整体素质,建立人才培养的新模式。必须坚持海纳百川,任人唯贤,坚持德才兼备,以德为先的用人标准,把品质高尚,实绩突出的优秀教师调动好、保护好、发展好。永兴小学教育近几年的探索和实践,不仅创造了“学校四无六有八建设”管理模式,还提升了“勤工俭学和养成教育”,也积累了宝贵的精神财富和理论创新,值得我们在今后的工作中认真总结和坚持;①只有始终保持解放思想和观念领先,才能应对当前教育体制改革的各种挑战,积极引领教育改革与发展,善于应用新的教育思想和观念破解难道,用新的教育理念,谋划永兴小学教育的发展创新,以教育观念的更新闯出教育改革与发展的新天地;②只有始终保持学校安全工作率先,才能保障正常的教育教学秩序,加快实现教育规范管理的进程,实现“学校四无六有八建设”,打造平安校园;③只有始终保持教师队伍建设抢先,才能打破制约永兴小学教育发展的瓶颈,汇聚形成发展动力,赢得广阔的发展空间;④只有始终保持教育质量当先,才能全力抢占学校生存与发展的空间,持续增强发展动力;⑤始终保持“勤工俭学,养成教育”的创新争先,才能全面增创竞争优势,充分迸发教育发展的新活力,形成山区的办学风格和特色;⑥只有始终保持“学校四无六有八建设”管理优先,才能依法治校,依法治教,构建现代教育规范管理的新体制,实现学校管理规范化、制度化、科学化、人性化、精细化和信息化的现代教育。
“对付你还用打群架,你以为自己是上古圣人转世啊?”一群人翻白眼,表示不屑。
06月15日,国产大型民用直升机AC313A开启高寒试飞,此前想去大凉山支教的杭州大学生陈立也告诉记者,他此前看到过一个7天6晚的大凉山支教研学团,售价高达10980元。而一般作为费用所占比例大头的食宿,在上述支教研学团费用中却仅需两三千元。并且,10980元的团费中还不包含往返大凉山的交通费,“去掉路程时间,实际只支教5天。并且食宿标准与项目价格相比对的话,性价比明显较低。”,球探网足球比分,必威官网网站,刺激战场 国际服 没线:环亚AG电游娱乐下载
06月15日,涉数万亿产值,千万就业岗位!“无废城市”建设全国推开,这等情况说出去,没有几个人会相信,一个孩子而已,竟敢深入太古遗种的巢穴,做出这等惊人的大事。,维多利亚vic67中国线路进不去,注册送钱的赌博台子,乐鱼手机APP。
06月15日,中方欢迎伊巴关系改善取得积极进展,日土县九年一贯制学校,经过三十多年的教育教学改革探索和实践,已逐步形成了独具特色的学风、教风和校风,办学条件大大改善,教学质量稳步提高。特别是近几年来,在县委、县政府的正确领导下,在上级业务部门的指导下,在社会各界的大力鼎助下,在学校班子的带领下,在全体师生的共同努力下,我校的各项事业都取得了长足发展。 青年时期是一个人最为美好、最为宝贵的人生阶段。青春是激情和力量,青春有梦想和希望。以爱国、进步、民主、科学为主要内涵的“五四”精神是我们中华民族进步的强大精神动力,值得我们去永远纪念和大力弘扬。五四青年节是你们青年人自己的节日,希望你们能弘扬和传承“五四精神”,清醒地认识到自己肩负的责任,以昂扬的锐气、良好的精神风貌、踏实创新的学习理念、健康积极的心态投入学习生活中去,学校和老师们愿意与你们一起同舟共济,去创造你们美好的明天。,娱乐城论坛,365bet体育注册开户,澳门人巴黎人网站。
天亮后,还没有等他们动身,大门外就传来了声音,一个洪亮的嗓音传来,道:“孩子,你在哪里,大叔接你来了,离开这个鬼地方,免得被那几个奴才欺负。”
新闻信息服务许可证音像制品出版许可证广播电视节目制作经营许可证网络视听许可证网络文化经营许可证山东省互联网传媒集团主办联系电话 违法不良信息举报电话