蘋(píng)果公司于2024年10月13日發(fā)布了最新版本的多模態(tài)AI大模型MM1.5,這一升級(jí)版在前代MM1的基礎(chǔ)上進(jìn)行了顯著改進(jìn)。多模態(tài)AI是指能夠處理和理解多種類(lèi)型數(shù)據(jù)(如文本、圖像、音頻等)的AI技術(shù)。據(jù)悉,MM1.5模型擁有300億參數(shù)規(guī)模,能夠處理圖像識(shí)別和自然語(yǔ)言推理任務(wù)。該模型…
蘋(píng)果公司于2024年10月13日發(fā)布了最新版本的多模態(tài)AI大模型MM1.5,這一升級(jí)版在前代MM1的基礎(chǔ)上進(jìn)行了顯著改進(jìn)。
多模態(tài)AI是指能夠處理和理解多種類(lèi)型數(shù)據(jù)(如文本、圖像、音頻等)的AI技術(shù)。據(jù)悉,MM1.5模型擁有300億參數(shù)規(guī)模,能夠處理圖像識(shí)別和自然語(yǔ)言推理任務(wù)。該模型繼續(xù)遵循數(shù)據(jù)驅(qū)動(dòng)的訓(xùn)練原則,重點(diǎn)研究在不同訓(xùn)練周期中混合不同類(lèi)型數(shù)據(jù)對(duì)模型性能的影響。
MM1.5模型不僅提升了OCR(光學(xué)字符識(shí)別)能力,支持任意圖像長(zhǎng)寬比和高達(dá)4M像素的分辨率,還擅長(zhǎng)理解富含文本的圖像。此外,通過(guò)額外的高質(zhì)量多圖像數(shù)據(jù)進(jìn)行監(jiān)督微調(diào)(SFT),進(jìn)一步提高了模型的上下文學(xué)習(xí)和開(kāi)箱即用的能力。這一版本還增強(qiáng)了對(duì)文本密集型圖像的理解、視覺(jué)指代和定位以及多圖像推理的能力。
蘋(píng)果公司在MM1.5模型中改進(jìn)了數(shù)據(jù)混合策略,顯著提升了模型在多文本圖像處理方面的表現(xiàn)。該模型提供了從10億到300億多種參數(shù)規(guī)模,能夠應(yīng)對(duì)各種復(fù)雜任務(wù)。相關(guān)模型文檔已在Hugging Face上發(fā)布,供研究人員和開(kāi)發(fā)者參考。
蘋(píng)果的AI戰(zhàn)略包括對(duì)多模態(tài)大模型MM1的開(kāi)發(fā)。在人工智能領(lǐng)域,蘋(píng)果公司的發(fā)展歷程可以分為幾個(gè)重要階段,從早期的硬件布局到后來(lái)的軟件和生態(tài)系統(tǒng)整合,再到最近推出的Apple Intelligence系統(tǒng),從封閉到開(kāi)放、從硬件到軟件的轉(zhuǎn)變。
蘋(píng)果公司正在加大對(duì)AI領(lǐng)域的投入,特別是在生成式AI的應(yīng)用上。例如,蘋(píng)果計(jì)劃每年投資10億美元,將生成式AI應(yīng)用于iOS、Siri、Apple Music和Xcode等一系列產(chǎn)品和服務(wù)中。2024年的全球開(kāi)發(fā)者大會(huì)(WWDC)上,蘋(píng)果推出了名為Apple Intelligence的新個(gè)人智能系統(tǒng)。該系統(tǒng)集成了生成式大模型,并深度整合到iOS、iPadOS、macOS等操作系統(tǒng)中,未來(lái)還將拓展到watchOS、tvOS以及visionOS。Apple Intelligence提升了設(shè)備端的AI能力,還通過(guò)端云結(jié)合架構(gòu)優(yōu)化了數(shù)據(jù)處理和用戶體驗(yàn)。
在硬件方面,蘋(píng)果專(zhuān)注于AI芯片與AI硬件創(chuàng)新。蘋(píng)果公司于2023年12月發(fā)布了新的機(jī)器學(xué)習(xí)框架MLX,這是一個(gè)專(zhuān)為Apple Silicon芯片設(shè)計(jì)的開(kāi)源框架,旨在優(yōu)化在蘋(píng)果芯片上的機(jī)器學(xué)習(xí)模型訓(xùn)練和部署。同時(shí),蘋(píng)果也在自主研發(fā)AI服務(wù)器,計(jì)劃在未來(lái)三年內(nèi)生產(chǎn)7萬(wàn)至8萬(wàn)臺(tái),大部分將使用Nvidia的芯片。
在軟件層面,蘋(píng)果正在重新設(shè)計(jì)其Siri數(shù)字助手,以更智能的方式提供查詢服務(wù),并將AI聊天機(jī)器人融入其軟件生態(tài)。此外,蘋(píng)果還與OpenAI合作,重點(diǎn)關(guān)注其自研的Ajax大模型的進(jìn)展。
AI布局上,蘋(píng)果公司除了自研還有收購(gòu),蘋(píng)果公司在今年年初就收購(gòu)了DarwinAI,以組建其人工智能團(tuán)隊(duì)。據(jù)市場(chǎng)調(diào)研,從2017年至2023年,蘋(píng)果共收購(gòu)了32家AI初創(chuàng)公司,這一數(shù)字超過(guò)了谷歌、Meta和微軟。這些收購(gòu)包括專(zhuān)注于語(yǔ)音識(shí)別、圖像識(shí)別和面部表情識(shí)別的公司。
蘋(píng)果在AI領(lǐng)域的戰(zhàn)略調(diào)整體現(xiàn)在多個(gè)方面,公司放棄了持續(xù)十年的電動(dòng)汽車(chē)項(xiàng)目“Titan計(jì)劃”,并將資源轉(zhuǎn)向生成式AI項(xiàng)目。
公司網(wǎng)址:jasain.com
時(shí)間:2024-11-23
時(shí)間:2024-11-23
時(shí)間:2024-11-23
時(shí)間:2024-11-23
電話咨詢:86-755-83294757
企業(yè)QQ:1668527835/ 2850151598/?2850151584/ 2850151585
服務(wù)時(shí)間:9:00-18:00
聯(lián)系郵箱:chen13410018555@163.com/sales@hkmjd.com
公司地址:廣東省深圳市福田區(qū)振中路新亞洲國(guó)利大廈1239-1241室
CopyRight?2022 版權(quán)歸明佳達(dá)電子公司所有 粵ICP備05062024號(hào)-12
官方二維碼
友情鏈接: