大模型让让,小模型登场丨科创要闻
4 月 23 日,大模登场微软推出小语言模型(SLM)Phi-3系列,型让有Phi-3-mini、模型Phi-3-small、丨科Phi-3-medium三个版本,创闻在评估语言、大模登场编程、型让数学能力等的模型基准测试中,Phi-3系列模型表现优于同等规模甚至更大规模模型(如GPT-3,丨科5)。微软称其是创闻目前同类中最强大且最具成本效益的小型语言模型。 Phi-3模型的大模登场“小体积”,让手机上运行高能力的型让语言模型成为可能。如Phi-3-mini只占用手机18GB内存,模型如在iPhone 14上部署,丨科苹果的创闻A16仿生芯片在设备上脱机运行,可以实现每秒超过12个token。 自2022年12月ChatGPT爆火之后,科技公司们一头扎进了大型模型的竞争,2023年接连刷新模型参数,2024年开始“内卷”长文本。大家似乎默认数据越多、参数越大、算力越强,模型的能力越强。 但是,高昂的运行成本、具体场景模型调试难度等问题,让大模型商业化的路径慢下来。此时小模型的优势就体现出来了。 小模型,目前某些领域也能接近大模型的性能。特别是在各手机和PC厂商正在力推的AIPC、AI手机上,对设备计算能力、运行能力、储存能力要求较低,能在地化运行的小模型,的确是不错的选择。 其实早在2023年6月份,微软就发布了第一代Phi模型,Phi-3系列已经是其第四代产品。近期,苹果公司也凑了小模型的热闹。 2024年4月24日,在大模型上没有什么动静的苹果公司,发布开源小语言模型OpenELM,包括
- 最近发表
- 随机阅读
-
- 化学制品逐步走向高端
- 新加坡辣椒螃蟹創始人逝世,當年意外把辣椒醬當番茄醬翻炒而創造這道美食
- 1年當兵、3年讀大學方案將公布,教育部再澄清《全動法》絕不會「讓學生上戰場」
- 《練習不想要》:不要從眾,不要追隨大多數,群體智商一般會低一些
- 三方共建基地 推动高校诚信建设迈上新台阶
- 【影評】《日麗》:童年既是養分亦為毒藥,端看我們如何咀嚼其中的苦澀與甜蜜
- 【專訪】衛武營藝術總監簡文彬:希望大家忘記這裡是「藝術文化中心」,而是放鬆與療癒身心的首選之地
- 《精準表達寫作術》:若想提升表達與寫作能力,平時就該減少或禁用形容詞概括所有心情
- 辽宁针对不正当竞争突出问题开展专项执法行动
- 學校沒教的事:由淺入深三個建議,讓你「聽音樂」的樂趣加倍
- 1年當兵、3年讀大學方案將公布,教育部再澄清《全動法》絕不會「讓學生上戰場」
- 【專訪】獨立書店「飛地」創辦人張潔平:在離散的時代裡重建社群與公共生活
- 中国青少年网球巡回赛诞生“三冠王”
- 《方圓》「後/Post」對談一:三代人的「後現代」經驗
- 世界棒球經典賽8日開打:台灣隊胡智爲扛先發迎戰巴拿馬,悍創:觀眾可帶國旗進場加油
- 「沙漠湖鹽」正夯:營養師三分鐘告訴你來源、組成、減鈉效果與適合族群
- 马蹄皮提取物对油条制作过程中丙烯酰胺生成抑制研究(一)
- 【小說】基列系列《傑克》選摘:一個牧師的女兒竟跟積習難改的流浪漢混在一起,這太荒謬了
- 日本藏壽司532家分店引進AI鏡頭防範顧客「迷惑行為」,警示音直通總部應對小組
- 自尊有四種樣貌,你是哪一種?這三個方法讓你進入「穩定高自尊」
- 搜索
-
- 友情链接
-