苹果Vision Pro的另一面:虚拟人3.0要爆发了

  • 来源: 驱动号 作者: 罗超频道   2023-06-13/09:48
  • 6月6日凌晨,苹果在WWDC 2023发布的初代MR头显Vision Pro引发行业热议,也重新点燃了XR行业的热情。相较于这款初代产品而言,由Vision Pro引爆的“空间计算革命”,对科技产业影响将更加深远。

    空间计算爆发虚拟人成空间互联网核心节点

    库克在发布Vision Pro时多次提到“空间计算(Spacial Computing)”这一新概念,他说Vision Pro是“革命性的新产品”,将带领人类进入空间计算时代。为什么库克要强调“空间计算”?因为传统互联网的本质是2D平面计算,各类应用给用户展示的文字、图片、视频和直播等内容,均是2D内容。2D直接限制了交互的可能性,人与人,人与内容,人与企业,人与数字世界的互动都被局限在2D平面上。

    而“空间计算”则让计算变得更立体。“空间计算”本质是虚拟与现实的深度融合,在XR(VRARMR)、3D、计算机图形学、机器视觉、物联网、传感、体感、AIGC等融合技术的加持下,用户可利用MR头显等终端以及全新空间操作系统vision OS,身临其境地与数字内容和空间环境进行互动,  内容变得多维,体验就像真人跟线下世界的实体交互一样。空间计算跟元宇宙的最大不同在于它不只是纯粹的线上空间,而是强化与现实世界的虚实融合,应用场景广阔许多。

    在空间计算中,最核心的交互载体是三维虚拟人——如同移动互联网的基础是“ID”一样,“ID”往往有账号、头像、昵称等信息,而虚拟人则具备外在形象、内在智能等要素,并具有视频化、可互动、24*7在线等特性。在空间互联网中,用户将以虚拟人的形式与其他人互动,企业则将以虚拟人的形象对外提供服务,虚拟人将是新一代互联网的核心节点。

    (内容科技公司魔珐科技制作的

    新一代虚拟人镜JING)

    在发布会上,苹果Vision Pro也展示了虚拟人的典型应用场景。很多人关心用户戴着Vision Pro跟人FaceTime时,对方会看到什么?其实在使用前Vision Pro就会对用户进行脸部等建模(也可以用iPhone实现),在扫描用户人脸三维信息后,vision OS将生成一个用户的虚拟人形象(Persona),当用户跟人视频通话时,这个虚拟人就能实时反映面部和手部动作。除了视频通话外,用户在vision OS上社交、娱乐、游戏、购物、游览等等,都将基于这个虚拟人进行。

    (头戴Vision Pro的用户

    用“虚拟人”进行FaceTime 通话)

    在基于vision OS的空间互联网内,互联网的整体形态都变了,虚拟人变得至关重要。苹果每一款革命性新品都能引爆一个乃至多个产业,比如iPhone引爆了移动互联网、共享经济、直播短视频、AI等产业,iPhone掀起的移动计算也彻底改变了世界。现在苹果掀起空间计算浪潮,不只是会重新激活XR产业,也将引爆虚拟人产业。

    虚拟人3.0问世,虚拟人智能体才是ChatGPT的终局

    苹果是科技行业的风向标。在任何新技术上,它都不是最初的“发明者”,甚至都不一定是“先行者”,但却十分善于整合技术。当对应技术趋于成熟时,苹果就会围绕用户需求做“重新发明者”,给引爆产业踢上临门一脚。

    在苹果提出“空间计算”概念、发布Vision Pro前,中国虚拟人产业就已在蓬勃发展。天眼查数据显示,我国现有“虚拟人”“数字人”的相关企业66.2万余家。2020年,涉及虚拟人领域的投融资案例95起,总金额约54.11亿元;2021年,涉及投融资案例149起,总金额约326.03亿元;截至2022年10月,虚拟人领域投融资案例49起,总金额约124.96亿元。

    虚拟人产业浪潮中已经涌现出头部企业,2018年成立的魔珐科技是其中的标杆。魔珐科技定位以计算机图形学和AI技术为核心的科技公司,不仅能为各行各业提供超写实虚拟人打造及PGC专业虚拟内容生产,还自研了UGC消费级虚拟人互动产品矩阵,能够实现高质量,高效率,低门槛的规模化商业化落地。

    虚拟人有着多年发展历史,最早可追溯到日本的虚拟偶像,1984年世界上第一位虚拟偶像“林明美”就已诞生。在魔珐科技创始人兼CEO柴金祥看来,40来年的虚拟人产业历程可分三个阶段:

    虚拟人1.0即虚拟偶像阶段,国外有“初音未来”等知名IP,国内有“洛天依”、“翎__Ling”等虚拟偶像。1.0的虚拟人可以拍图片、录视频,但制作成本高、制作周期长、变现难度大。与此同时,1.0的虚拟人只能单向输出内容“表演”,无法跟粉丝进行任何形式的实时互动。

    (国风虚拟偶像“翎__Ling”)

    虚拟人2.0即互动式虚拟偶像阶段,除能拍图片、录视频外,还可走进直播间与用户实时互动,魔珐科技打造的国风虚拟偶像“令颜欢”是其中代表,2023年出道后以精准卡位国风题材及出色的“直播互动性”而备受关注,首场直播冲上人气榜第87位,是迄今为止在抖音直播榜单上人气最旺的虚拟人。

    (在抖音直播取得不俗成绩的虚拟主播“令颜欢”)

    魔珐科技曾打造众多虚拟人标杆,不只是虚拟偶像,魔珐科技还让多家企业拥有了自己的虚拟人IP,其服务了数百家五百强企业及外资品牌,遍布游戏、娱乐、消费、电商、金融、科技教育、医疗、文旅等行业,其客户不乏特斯拉、保时捷、宝格丽、阿里巴巴、腾讯、字节跳动、百度、央视、、新华社、中金财富、欧莱雅、Oppo、小米、科大讯飞、伊利等不同行业的头部知名企业。

    如今,虚拟人3.0时代正式来临。除拥有前两代虚拟人的图片、视频和直播“一对多”互动能力外,还能实现“一对一”的实时智能交互,基于此可提供24*7的专业信息服务,比如销售、客服,与此同时,它们在AIGC等技术加持下可以持续成长进化,具备越来越人性化的交互能力和越来越深度垂直的知识能力。

    今年五月,魔珐科技推出全新一代虚拟人智能体“镜JING”,就是虚拟人3.0的代表,她在图片、视频、直播中的外在形象生动写实、流畅精细,更重要的是,她具有极强的实时交互能力和智能学习能力,前者意味着它可以承载1V1服务,后者意味着它可以不断学习进化。她能理解对话也能表达沟通,能够带来实时智能交互的全新体验。

    在魔珐科技近期举办的新品发布会上,“镜JING”担当了发布会主持人,她展示了品牌的核心理念,按照流程发布了新产品,在发布时可以跟“大佬”一样介绍及演示产品,甚至可参与到答疑Q&A、媒体群访中。

    “做发布会主持人”只是虚拟人智能体的起点。据魔珐科技透露,其正在研发多款消费级虚拟人,今年8月将推出三款AIGC 消费级超写实虚拟人产品——“有光”虚拟直播、“有灵”交互虚拟人、“有言”虚拟人视频生成,它们将可以帮助企业实现低成本轻松开播,让企业自己操作“零代码、傻瓜式”打造自己AI交互虚拟人以及一键轻松生成虚拟人视频。

    镜JING可以沉淀行业深度知识和服务能力,融入到任意场景中,比如商业直播、企业官网宣传、线下发布会等诸多企业应用场景,以及电商直播,客服,销售,法律,财务,心理,教学,培训等等多种行业场景。

    “镜JING”堪称虚拟人的一大步,如同Vision Pro之于XR产业的价值一样。它最大的价值在于引入了“智能体”的概念,也就是将ChatGPT这样的智能助理进行了“实体化”。

    在ChatGPT爆发后,Siri等传统智能助理遭遇巨大挑战,微软宣布将在2023年年底停止支持Windows 10/Windows 11上的语音数字助理Cortana(小娜),Cortana(小娜)有着10年发展历程,跟Siri、小度、小爱同学等一样属于深度学习技术驱动的老一代智能助理。大模型时代的智能助理是怎样的?微软推出了GPT-4驱动的Copilot,手机行业则出现了大模型 for IoS,大模型手机等概念,智能助理本已暗流涌动。

    而从“镜JING”的形态来看,“虚拟人智能体”很可能会是ChatGPT类智能助理的终极形态。

    不论是ChatGPT还是Siri等上一代智能助理,抑或是微软新一代大模型智能助理Copilot,均是基于平面计算的文本交互,这在手机等平面设备上能够勉强使用,但随着苹果Vision Pro掀起的空间革命浪潮,以及XR等新一代设备的普及,多模态的交互将成为可能,也会成为刚需。以虚拟人为载体的交互将会普及,表情、眼神、手势、语音、环境等等内容都可以成为用户输入的信息与终端输出的内容。换言之,在空间计算时代,“多模态交互”才是人与人之间最自然、最高效的交互形态。

    虚拟人在传统的提供信息搜索与查询的基础上,增加更多真正的智能助理应该有的属性,可以是贴心的生活管家助手,也可以是人类的智能分身,可以跨越时空去陪伴需要陪伴的人,真正融入生活,“有灵魂、有身份、有感情”。

    对于“虚拟人”可以提升用户体验这一点,很多科技巨头都想清楚了,比如百度旗下的小度就化身成为虚拟人“度晓晓”在百度App等场合下给用户提供搜索服务,不过囿于技术能力,“度晓晓”的交互能力十分有限,只能简单地眨眨眼、动动嘴、改变下表情。虚拟人3.0则更加写实精致,配以自然生动的表达能力,同时具有1V1实时互动能力及基于AI大模型的进化学习能力。

    “镜JING”给虚拟人3.0打了一个样,这背后离不开魔珐科技5年来打造数百个虚拟人IP所积累的领先的图形学及AI核心技术的加持。基于对虚拟人产业的洞察以及专注于此的技术积累,魔珐科技将为企业打造“镜JING”这样的虚拟人智能体,并借助消费级产品矩阵的推出,让人人拥有虚拟人(Persona)变为可能。

    苹果掀起空间计算浪潮,人人都将拥有虚拟人

    Vision Pro让虚拟人生成变得容易了许多,届时只要购买Vision Pro的用户都将拥有专属的虚拟人身份。不过,这款产品的正式发售还要等到2024年,3499美元(约合人民币2.5万元)的初代价格对很多人来说也高不可攀。相较而言,中国的虚拟人企业进展更快一些,魔珐科技耗时5年推动虚拟人从虚拟偶像的1.0时代向“人人都有虚拟人”的3.0普惠时代进化,这里的人人既有普通用户,也有企业等各类组织,“以人为本”的场景将向“以虚拟人为本”跨越。

    今天,虚拟人3.0普及正当时:

    第一,空间计算让虚拟人有了更多的应用场景和承载终端,虚拟人工业化将加速。除了PC、平板、手机等通用主流终端外,虚拟人还将在AR、VR、MR等终端上与用户更好地交互,在XR设备上虚拟人的多维多模态互动潜力将得到彻底释放。应用需求的爆发反过来会推动产业链的进一步繁荣,比如制作标准的进一步完善,制作成本的指数级下降,制作人才的大规模涌入,结果就是虚拟人3.0会更成熟,更普及,更普惠,人人都有虚拟人将不再遥远。

    第二,ChatGPT引爆大模型浪潮,AI从昔日的感知与认知,进化到今天的内容生成,AIGC技术正在爆发式增长。而虚拟人本质是科技驱动的内容产业,是天然的AIGC应用场景。

    据魔珐科技相关技术人士介绍,要打造一个有形象、能表达、能交互的超写实虚拟人智能体,不仅需要全栈式的三维美术能力,包括原画、模型、绑定、动画、解算、特效、灯光等,更涉及各类人工智能和图形学能力,包括AIGC三维虚拟人的建模和绑定能力,AIGC三维动画和语音生成能力,语音识别能力,以及类似chatGPT文生文的AI交互能力等。需要企业具备全栈技术和美术能力作为支撑,就像木桶原理一样,缺少任何一部分都无法完成。

    显而易见,虚拟人的打造过程本质是用科技创造内容的过程,AIGC将彻底改变这一过程,一方面,智能实时生成表情、眼神、手势、语音、身体动作等,给虚拟人3.0的实时智能交互提供基础;另一方面可AIGC三维动画、语音等虚拟人建造内容,让虚拟人制作“降本增效”。

    魔珐科技在众多虚拟人公司中脱颖而出,正是因为其具有技术基因。魔珐科技创始人兼CEO柴金祥教授是计算机图形学和AI领域的世界顶级专家,在AI虚拟人领域有近20年的潜心研究。他创立的魔珐科技也一直在围绕计算机图形学和AI两大核心技术构建全栈技术、产品和运营能力,这让其在AIGC时代构建虚拟人3.0更得心应手。实际上,“镜JING”就是一个AIGC的综合体,比如文生语音、视频、直播,以及她与用户实时互动的表情、眼神、手势、交互等,都是AIGC生成。

    魔珐科技致力于提供虚拟人的AIGC内容,希望帮助企业低门槛生成虚拟人视频,协助企业完成日常的公关播报、产品种草,或是日常资讯发放,都能直接为企业的品牌市场、新媒体运营等部门减少日常内容运营的压力。AIGC之所以成为一种趋势,其最核心的价值在于,以前,内容生产都要靠最专业的人,花费一定的时间和精力,是一种高门槛,高成本,低效率的工作。那现在,AIGC能力把内容生产的门槛降低了。

    用柴金祥的话说,魔珐科技成立五年来,“所做的事情在国内外都没有先例。我们一直在自我迭代和探索,希望能做到可规模化商业化落地,并且是高质量,高效率,低门槛。”AIGC这一“武器”直接加速了虚拟人技术数年的进度,魔珐科技将更早实现其雄心壮志。

    虚拟人加速商业化,企业级应用是先导场景

    除区块链先以比特币在消费端应用外,其余新兴IT技术均是从B端开始商业化应用,再逐步溢出到消费场景,比如PC、互联网、XR、IoT、AI等等。虚拟人也不例外,以其中佼佼者魔珐科技为例,它已通过给数百家企业打造上百个虚拟人IP实现商业化,不但能够提供超写实虚拟人打造及PGC专业虚拟内容生产,还自研了UGC消费级虚拟人互动产品矩阵,也是业内唯一一家同时具有技术、产品、内容与运营的全栈能力的玩家,且对应能力都业界领先。

    在6月2日的新品发布会上,基于对B端客户对虚拟人的需求的洞察,魔珐科技推出了杀手锏产品“虚拟人企业名片”,这一产品面向企业,意在取代企业原来标配的“官网”+“定妆照PPT”。一般来说,上规模的企业都会有自己的官方网站(往往有PC网页、WAP、H5、小程序等形式)和公司介绍PPT,不过这样的展示都是单向的、静态的、无聊的。而“虚拟人企业名片”则让企业对外传播随时随地“有形象、视频化、可互动”。

    具体来说,企业可将“虚拟人企业名片”嵌入到PC端网页、手机APP、公众号和小程序等互联网平面终端中,也可加载到线下大屏幕、带屏移动机器人、商场导览仪、AR/VR等载体中,与用户进行以虚拟人为载体实时视频互动,好处显而易见。

    注意力碎片化的今天,用户特别是年轻人更习惯消费多媒体内容,特别是短视频、直播等内容,对传统的静态图文内容越来越无感,对XR、虚拟人等新兴的内容接纳度则很高;对单向的灌输式内容选择性过滤和快速遗忘,对双向的真诚互动更有兴趣。打开电商App看产品和店铺介绍就明白了:短视频几乎已成标配,有实力的商家都在做直播。企业品牌要抓住用户注意力,必须要改变原来的以平面图文为主的单向讲解模式,升级到以虚拟人为载体实时视频互动模式。

    当用户来到展示“虚拟人企业名片”的对应渠道时,结合企业/品牌/产品形象定制的虚拟人会先进行热情接待,再生动地介绍与展示产品,同时随时准备与用户互动、答疑和进行产品推荐。“虚拟人企业名片”适合企业对外宣传、销售、招聘、客服、展厅展示等外部沟通,以及企业内部培训等多种场景。具备“科技+内容”双重基因的魔珐科技也给企业提供了AIGC的内容能力,并将通过产品化矩阵,协助企业自己生成虚拟人视频、日常公关通告、企业新闻动态、产品种草内容、核心技术科普、品牌活动信息等。

    在高质量增长的趋势下,所有企业都在加速数智化升级,内外展示沟通、产品销售转化、品牌营销互动这些正是数智化的关键经营环节。魔珐科技提供的“虚拟人企业名片”让企业直接拥抱ChatGPT的终极形态,与用户进行更有效率和效果的互动,实现交易转化、内外沟通和品牌建设,不只可以直接省掉许多岗位人力实现降本增效,也可以让对外沟通与服务更加标准化,且品质可控。

    “虚拟人企业名片”的推出仅仅是开始,据此次发布会透露,魔珐科技8月即将发布“有光”虚拟直播、“有灵”交互虚拟人、“有言”虚拟人视频生成三款消费级虚拟人产品,它们将可以帮助企业实现低成本轻松开播,让企业自己操作“零代码、傻瓜式”打造自己的虚拟人企业名片以及一键轻松生成虚拟人视频。魔珐科技自研的三款UGC消费级虚拟人互动产品,解决的是虚拟人的核心技能,让企业不仅能够拥有自己的虚拟人,还能做到“开源”,让企业对虚拟人的应用落到实际场景之中,切实解决企业运营传播中的实际问题。

    长期来看,魔珐科技已经做好了从技术、产品到服务的全维度架构,以AIGC技术,为企业打造覆盖不同场景、不同业务、不同岗位的智能虚拟人员工,从而实现白领工作的AI化,让企业降本增效的同时,带来更加卓越且稳定的服务体验。此前已有多家知名企业如万科等推出了虚拟人员工,但目前仅仅是高度定制的“虚拟人1.0或者虚拟人2.0”,而魔珐科技要做的,是希望用虚拟人技术与产品赋能企业,帮助各行各业打造拥有满足不同岗位的“虚拟人3.0员工”,助力企业真正一站式实现全链路数智化升级。

    正如柴金祥在发布会所说,“如果说工业机器人是企业蓝领的AI化,那虚拟人智能体就是明星与企业白领的AI化,这将是一个万亿级的巨大赛道。”企业白领的AI化,意味着虚拟人承载的电商主播、心理咨询、智能投顾、保险顾问、导游、导购、物业经理、中介、销售,教师、HR等“虚拟人AI白领”将大规模批量上岗。

    企业级场景的持续落地带来了真金白银,但魔珐科技一直坚持to B与to C融合发展,消费端它成功推出“翎__Ling”“令颜欢”等面向C端市场的虚拟人IP且均大获成功。未来它也势必会基于全栈虚拟人技术打造更多消费端产品,比如给个人用户提供虚拟人形象,以供其应用在娱乐互动、相亲交友、工作学习、兴趣社交等场景。

    写在最后:

    有人说苹果WWDC 2023给人一种感觉就是:苹果距离AI越来越远,因其重注Vision Pro、拥抱空间计算。实则不然,Vision Pro、空间计算、虚拟人均跟AI特别是AIGC息息相关。现在科技产品创新一定要靠多重技术高度整合创新,正如虚拟人技术高度依赖计算机图形学、AIGC、空间计算等技术一样。所有前沿科技企业殊途同归,它们都在对不同技术进行高度整合,给市场提供更有价值的产品,重塑人与人,人与内容,人与空间,人与世界的交互体验。虚拟人、AIGC、空间计算、XR均大浪澎湃,未来可期。

    —特别策划—


    评论 {{userinfo.comments}}

    {{money}}

    {{question.question}}

    A {{question.A}}
    B {{question.B}}
    C {{question.C}}
    D {{question.D}}
    提交

    {{userinfo.nickname}}

    文章数: {{userinfo.count}}
    访问量: {{userinfo.zongrenqi}}

    驱动号 更多