2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ 備案號(hào):
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
郵箱:toplearningteam#gmail.com (請(qǐng)將#換成@)
近日,蘋果公司研發(fā)團(tuán)隊(duì)發(fā)布論文稱開發(fā)出了一款創(chuàng)新人工智能系統(tǒng),它可以理解屏幕上的模糊內(nèi)容并且根據(jù)對(duì)話和背景,實(shí)現(xiàn)與語音助手更加自然的互動(dòng),這一系統(tǒng)被命名為ReALM。
ReALM的創(chuàng)新點(diǎn)在于可以重新構(gòu)建屏幕內(nèi)容,對(duì)屏幕上的信息以及位置生成相應(yīng)的文本提示,研究人員對(duì)這種方法進(jìn)行了展示,宣稱執(zhí)行相關(guān)任務(wù)時(shí)能力甚至可以超越GPT-4,這樣的成績(jī)引起了許多人的關(guān)注。
這一研究顯示了語言模型在處理內(nèi)容指向解析等方面的巨大潛力,現(xiàn)在由于計(jì)算資源以及響應(yīng)時(shí)間方面的限制,大型的端到端模型難以實(shí)施,這一項(xiàng)創(chuàng)新性研究展示出了蘋果持續(xù)投入之下產(chǎn)生的成果。
演示成果中ReALM顯示出了出色的能力,但是現(xiàn)在自動(dòng)化解析屏幕內(nèi)容仍然面臨一定的挑戰(zhàn)。在處理更加復(fù)雜的視覺內(nèi)容時(shí),這一模型可能需要結(jié)合計(jì)算機(jī)視覺以及多模態(tài)技術(shù),這會(huì)帶來更多的挑戰(zhàn)。
蘋果目前在人工智能領(lǐng)域稍微有些落后,但是它正在積極取得新的進(jìn)展,從融合視覺和語言的多模態(tài)模型,到開發(fā)以AI作為驅(qū)動(dòng)的動(dòng)畫工具、構(gòu)建高性能的AI技術(shù)等等,蘋果在許多領(lǐng)域?qū)崿F(xiàn)了技術(shù)突破。
實(shí)際上蘋果在創(chuàng)新領(lǐng)域扮演的更多是追隨者的角色,而不是領(lǐng)先者,目前人工智能技術(shù)正在加速互聯(lián)網(wǎng)格局出現(xiàn)深刻變革。在這樣的背景下,蘋果如何掌握先機(jī)成為行業(yè)內(nèi)的領(lǐng)軍人物,或者保持自己第一梯隊(duì)的位置,是值得思考的事情。
蘋果在資金實(shí)力、品牌忠誠度、產(chǎn)品線以及團(tuán)隊(duì)實(shí)力等方面仍然具有顯著的優(yōu)勢(shì),希望在諸多互聯(lián)網(wǎng)公司的推動(dòng)下,AI技術(shù)可以盡快迎來突破性的發(fā)展。
2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ 備案號(hào):
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
郵箱:toplearningteam#gmail.com (請(qǐng)將#換成@)