原標(biāo)題:Soul創(chuàng)始人張璐團(tuán)隊(duì)推出多模態(tài)社交應(yīng)用,促進(jìn)社交體驗(yàn)創(chuàng)新迭代
在AI大模型全面發(fā)展的當(dāng)下,多模態(tài)模型是當(dāng)前訓(xùn)練和開發(fā)的重要方向,在社交行業(yè)實(shí)踐中顯現(xiàn)出極強(qiáng)的可交互性,能夠提升應(yīng)用的可用性,帶來(lái)更豐富的社交體驗(yàn)。新型社交平臺(tái)Soul App創(chuàng)始人張璐團(tuán)隊(duì)正積極迭代升級(jí)多模態(tài)能力,致力打造社交“多邊形戰(zhàn)士”。
Soul的“AI+社交”布局正朝著多模態(tài)方向不斷升級(jí),而促進(jìn)虛擬人在文字、語(yǔ)音、圖片等方面模態(tài)的相互結(jié)合是Soul的主攻方向。在Soul 創(chuàng)始人張璐看來(lái),產(chǎn)品有一個(gè)文字對(duì)話的基礎(chǔ)得分,做得很好就可以得到六七十分。如果基礎(chǔ)得分不好,即使聲音做得再好,圖片理解方面再出色也不行。確定拿到基礎(chǔ)得分后,接下來(lái)就是不斷迭代,做好多模態(tài)爭(zhēng)取更好的表現(xiàn)。為此,夯實(shí)文字對(duì)話基礎(chǔ)是Soul虛擬人升級(jí)的第一步。
Soul的各類AI功能升級(jí)離不開自研大模型SoulX的助力。SoulX具備了prompt驅(qū)動(dòng)、條件可控生成、上下文理解、多模態(tài)理解等能力。這一多模態(tài)能力不僅提升了虛擬人在帖子、圖片、音頻等多種形式創(chuàng)作上的能力,也還讓Soul的一眾社交場(chǎng)景產(chǎn)生了更多高質(zhì)量的內(nèi)容。
與此同時(shí),在夯實(shí)文字對(duì)話能力后,Soul也在持續(xù)優(yōu)化語(yǔ)音系統(tǒng)。語(yǔ)音模態(tài)是Soul比較看重的一大功能。Soul創(chuàng)始人張璐表示:“語(yǔ)音是一個(gè)相對(duì)重要的點(diǎn),可能會(huì)占30分。語(yǔ)音其實(shí)有很多人在做的,有非常多的解決方案,我們會(huì)聚焦在AI語(yǔ)音賦能‘溫度’和‘陪伴感’方向,因?yàn)樯缃换?dòng)本質(zhì)上是情感的流動(dòng)”。這個(gè)多邊形戰(zhàn)士不僅需要具備多模態(tài)的能力,還需要情感化,而不只是提升效率的工具。虛擬人需要找到用戶的情緒價(jià)值點(diǎn),同時(shí)具備個(gè)性化,展現(xiàn)出不同的性格特征;有時(shí)候應(yīng)該順應(yīng)用戶,有時(shí)候應(yīng)該拒絕用戶。
目前,Soul表現(xiàn)較好的虛擬人有AI茍蛋。AI茍蛋是一個(gè)多模態(tài)的機(jī)器人,有非常明顯的擬人傾向。比如,用戶分享一個(gè)照片,它能夠根據(jù)對(duì)照片上的內(nèi)容和時(shí)間理解,判斷發(fā)生什么事情,然后進(jìn)行主動(dòng)地關(guān)懷和互動(dòng)。還能基于和用戶的歷史聊天內(nèi)容,沉淀回憶、構(gòu)建個(gè)人專屬記憶的虛擬伙伴。從Soul公開的數(shù)據(jù)看,AI茍蛋的對(duì)話輪數(shù)比較高,用戶平均每天會(huì)給茍蛋發(fā)送超過(guò)70條消息,互動(dòng)平均時(shí)長(zhǎng)超過(guò)30分鐘。這其實(shí)已經(jīng)意味著,很多用戶把茍蛋當(dāng)做了可以持續(xù)互動(dòng)聊天的伙伴。
從大模型的發(fā)展趨勢(shì)看,多模態(tài)是發(fā)展的必經(jīng)之路,AIGC大模型從單模態(tài)向多模態(tài)發(fā)展已成為行業(yè)共識(shí)。Soul創(chuàng)始人張璐團(tuán)隊(duì)不斷更新多模態(tài)社交應(yīng)用、促進(jìn)社交體驗(yàn)好上加好,體現(xiàn)了Soul 追求卓越、臻于至善的發(fā)展態(tài)度,也體現(xiàn)了Soul對(duì)用戶體驗(yàn)提升與對(duì)社交行業(yè)發(fā)展的創(chuàng)新能力。
投稿郵箱:chuanbeiol@163.com 詳情請(qǐng)?jiān)L問(wèn)川北在線:http://sanmuled.cn/