2022年人工智能5大發(fā)展趨勢(shì)
發(fā)布時(shí)間:2022-01-20 17:19:04
近幾年隨著各行業(yè)對(duì)于自動(dòng)化需求的提高,為人工智能帶了了一次巨大的提升機(jī)會(huì)。隨著深度學(xué)習(xí)的開放,人工智能在幾年中快速發(fā)展,由尖端技術(shù)慢慢向著開始普及在各行業(yè)和家庭生活中。以下是國(guó)外一家專注于開源和堆棧技術(shù)新聞網(wǎng)站TheNewStark盤點(diǎn)的2022年值得人們期待的五個(gè)人工智能發(fā)展趨勢(shì)。
大型語言模型(LLMs),定義交互式人工智能的下一個(gè)浪潮
大型語言模型(LLMs)是在包含巨大數(shù)據(jù)量的大規(guī)模數(shù)據(jù)集上訓(xùn)練的。像是Google的BERT和OpenAI的GPT-2和GPT-3就是LLMs很好的例子。據(jù)了解,GPT-3中約有1750億個(gè)參數(shù),在570千兆字節(jié)的文本上進(jìn)行訓(xùn)練。這些模型生成的東西可以從簡(jiǎn)單的文章到復(fù)雜的金融模型。
現(xiàn)如今,包括OpenAI、HuggingFace、Cohere、AI21Labs以及AI12在內(nèi)的人工智能初創(chuàng)公司,正在通過訓(xùn)練具有數(shù)十億參數(shù)的模型來推動(dòng)LLMs的發(fā)展。
在2022年,我們將看到大型語言模型成為下一代交互式人工智能工具的基礎(chǔ)模型。
多模態(tài)人工智能的崛起
首先,什么叫做模態(tài)(Modality)呢?
每一種信息的來源或者形式,都可以稱為一種模態(tài)。例如,人有觸覺,聽覺,視覺,嗅覺;信息的媒介,有語音、視頻、文字等;多種多樣的傳感器,如雷達(dá)、紅外、加速度計(jì)等。以上的每一種都可以稱為一種模態(tài)。
同時(shí),模態(tài)也可以有非常廣泛的定義,比如我們可以把兩種不同的語言當(dāng)做是兩種模態(tài),甚至在兩種不同情況下采集到的數(shù)據(jù)集,亦可認(rèn)為是兩種模態(tài)。
因此,多模態(tài)機(jī)器學(xué)習(xí),英文全稱MultiModal Machine Learning(MMML),旨在通過機(jī)器學(xué)習(xí)的方法實(shí)現(xiàn)處理和理解多源模態(tài)信息的能力。目前比較熱門的研究方向是圖像、視頻、音頻、語義之間的多模態(tài)學(xué)習(xí)。
多模態(tài)人工智能的最新例子是OpenAI的DALL-E,該模型使用藝術(shù)家薩爾瓦多-達(dá)利和皮克斯的瓦力的諧音來命名。它可以從文本描述中生成對(duì)應(yīng)圖像。例如,當(dāng)文本描述為"一個(gè)甜甜圈形狀的時(shí)鐘"被發(fā)送到該模型時(shí),它就可以生成以下圖像。
NVIDIA的GauGAN2型號(hào)將根據(jù)簡(jiǎn)單的文本輸入生成照片般逼真的圖像。它將分割映射、內(nèi)繪畫和文本到圖像生成結(jié)合在一個(gè)模型中,使其成為創(chuàng)建具有文字和繪圖組合的照片級(jí)真實(shí)感藝術(shù)的強(qiáng)大工具。
簡(jiǎn)化和精簡(jiǎn)MLOps
機(jī)器學(xué)習(xí)操作(MLOps),是一個(gè)將機(jī)器學(xué)習(xí)投入到工業(yè)生產(chǎn)中的實(shí)踐,是機(jī)器學(xué)習(xí)和DevOPs在軟件領(lǐng)域交叉的產(chǎn)物,所以它在許多方面與2012年的DevOps相似。
在2012年DevOps上線的時(shí)候,許多企業(yè)就意識(shí)到了它的價(jià)值,但是他們?cè)趯?shí)施DevOps的時(shí)候很困難,工具鏈非常復(fù)雜,生態(tài)系統(tǒng)也不夠完善。而MLOps相比來說更加復(fù)雜,它的軟件包包括安裝、配置訓(xùn)練、推理基礎(chǔ)設(shè)施、配置特征存儲(chǔ)、配置模型注冊(cè)表、監(jiān)控模型的衰減以及檢測(cè)模型漂移等所有的相關(guān)內(nèi)容。
其龐大的軟件包也導(dǎo)致MLOps的部署比DevOps還困難。
MLOps是被納入基于云計(jì)算的ML平臺(tái)的概念之一,平臺(tái)包括如亞馬遜網(wǎng)絡(luò)服務(wù)的AmazonSageMaker, Azure ML, 以及谷歌的VertexAI。
然而,它所擁有的這些能力卻不能用于混合和邊緣計(jì)算這兩個(gè)環(huán)境。因此,監(jiān)測(cè)邊緣計(jì)算的環(huán)境模型被證明是企業(yè)要面臨的一個(gè)重大挑戰(zhàn)。
在處理計(jì)算機(jī)視覺系統(tǒng)和交互式人工智能系統(tǒng)時(shí),創(chuàng)建一個(gè)為其服務(wù)的監(jiān)測(cè)邊緣計(jì)算的模型就變得更加具有挑戰(zhàn)性。
隨著Kubeflow和MLflow等開源項(xiàng)目的逐漸成熟,MLOps其實(shí)已經(jīng)很容易就能獲取到。在未來幾年我們或許可以看到一個(gè)精簡(jiǎn)和簡(jiǎn)化的MLOps方法橫跨云領(lǐng)域和邊緣計(jì)算環(huán)境。
AI驅(qū)動(dòng)的開發(fā)者生產(chǎn)力
在未來,人工智能幾乎會(huì)影響到IT行業(yè)的每個(gè)方面,包括編程和開發(fā)。在過去的幾年里,我們已經(jīng)看到了諸如亞馬遜代碼大師這樣的工具,該產(chǎn)品會(huì)在開發(fā)者編程時(shí),為其提供智能建議,以提高代碼質(zhì)量,并識(shí)別出應(yīng)用程序中最重要的代碼行。
就在最近,GithubCopilot作為一個(gè) "人工智能配對(duì)程序員"首次亮相,協(xié)助開發(fā)人員編寫高效的代碼。而Salesforce的研究團(tuán)隊(duì)也推出了CodeT5,這是一個(gè)開源項(xiàng)目,將幫助Apex開發(fā)人員進(jìn)行由人工智能驅(qū)動(dòng)的編碼。
Tabnine,即以前的Codata,將智能代碼完全帶到了主流開發(fā)環(huán)境。Ponicode也是一個(gè)AI驅(qū)動(dòng)的工具,可以提供函數(shù)創(chuàng)建、可視化和運(yùn)行單元測(cè)試的快捷方式。
型語言模型(LLMs)的興起和開源代碼更廣泛的可用性,使IDE供應(yīng)商能夠再其基礎(chǔ)上建立智能代碼生成和分析系統(tǒng)。
展望未來,人們期望看到能夠從內(nèi)聯(lián)注釋中生成高質(zhì)量和緊湊代碼的工具。它們甚至能夠從一種語言編寫的代碼翻譯成另一種語言,通過將傳統(tǒng)代碼轉(zhuǎn)換為現(xiàn)代語言來實(shí)現(xiàn)應(yīng)用程序的現(xiàn)代化。
云平臺(tái)新的垂直化人工智能解決方案
世界領(lǐng)先的人工智能供應(yīng)商,包括亞馬遜、谷歌和微軟,都正專注于將研究和開發(fā)工作商業(yè)化。他們通過旗下的云平臺(tái)提供托管服務(wù),并建立硬件設(shè)備,配備人工智能加速器和針對(duì)特定場(chǎng)景的預(yù)訓(xùn)練模型。
亞馬遜連接和谷歌聯(lián)絡(luò)中心AI是垂直整合的典型例子。兩者都利用機(jī)器學(xué)習(xí)能力來執(zhí)行智能路由,由機(jī)器人驅(qū)動(dòng)的客服對(duì)話,以及對(duì)聯(lián)絡(luò)中心代理商的自動(dòng)協(xié)助。
AWSPanorama可以連接到現(xiàn)有的IP攝像機(jī),以此來執(zhí)行基于計(jì)算機(jī)視覺的推理??蛻艨梢栽谄湓破脚_(tái)訓(xùn)練新的模型,并將它們部署在全景設(shè)備的邊緣。
AzurePercept采用了類似的方法,在邊緣提供計(jì)算機(jī)視覺模型和交互式人工智能。微軟基于Azure上現(xiàn)有的物聯(lián)網(wǎng)、人工智能和邊緣計(jì)算服務(wù)建立了Percept。
最后,亞馬遜Lookoutfor Equipment和谷歌CloudVisual InspectionAI等服務(wù),利用基于云的人工智能平臺(tái),對(duì)設(shè)備進(jìn)行預(yù)測(cè)性維護(hù)和產(chǎn)品的異常檢測(cè)。這些服務(wù)是專為零售和制造業(yè)定制的。
在2022年,我們將看到人工智能平臺(tái)和云供應(yīng)商利用前沿研究技術(shù)和現(xiàn)有的管理服務(wù),提供針對(duì)特定的例子和場(chǎng)景的解決方案。
參考鏈接:5AI Trends to Watch out for in 2022 – The New Stack
更多新鮮有趣的計(jì)算機(jī)相關(guān)指示、新聞,記得關(guān)注盛圖科技哦
- 上一篇:程序員35歲即失業(yè)?
- 下一篇:過年了,七大姑八大姨:你工資多少啊?