大模型让让,小模型登场丨科创要闻
4 月 23 日,大模登场微软推出小语言模型(SLM)Phi-3系列,型让有Phi-3-mini、模型Phi-3-small、丨科Phi-3-medium三个版本,创闻在评估语言、大模登场编程、型让数学能力等的模型基准测试中,Phi-3系列模型表现优于同等规模甚至更大规模模型(如GPT-3,丨科5)。微软称其是创闻目前同类中最强大且最具成本效益的小型语言模型。 Phi-3模型的大模登场“小体积”,让手机上运行高能力的型让语言模型成为可能。如Phi-3-mini只占用手机18GB内存,模型如在iPhone 14上部署,丨科苹果的创闻A16仿生芯片在设备上脱机运行,可以实现每秒超过12个token。 自2022年12月ChatGPT爆火之后,科技公司们一头扎进了大型模型的竞争,2023年接连刷新模型参数,2024年开始“内卷”长文本。大家似乎默认数据越多、参数越大、算力越强,模型的能力越强。 但是,高昂的运行成本、具体场景模型调试难度等问题,让大模型商业化的路径慢下来。此时小模型的优势就体现出来了。 小模型,目前某些领域也能接近大模型的性能。特别是在各手机和PC厂商正在力推的AIPC、AI手机上,对设备计算能力、运行能力、储存能力要求较低,能在地化运行的小模型,的确是不错的选择。 其实早在2023年6月份,微软就发布了第一代Phi模型,Phi-3系列已经是其第四代产品。近期,苹果公司也凑了小模型的热闹。 2024年4月24日,在大模型上没有什么动静的苹果公司,发布开源小语言模型OpenELM,包括
-
上一篇
-
下一篇
- 最近发表
-
- 北京石景山开展年货市场商品过度包装执法检查
- 為什麼LeBron James跟Anthony Davis同時上場時,湖人隊的進攻還能這麼糟?
- Cymetrics揭露7成臺灣五星飯店電郵設置不全 消費者易遭詐騙威脅
- 台灣脫口秀流行「地獄哏」不等於美式幽默,喜劇表演者必須承擔演出後果
- 福建:高效办成一件事 便民服务再升级
- 長榮機師不罷工了:勞資雙方達3點共識、機師工會同意2026年前不再就此發動爭議行為
- 【專訪】金漫大獎《星咒之絆》漫畫家Moonsia:不要太拘謹、放開侷限,就是我的最佳表現
- 全球首例氮氣窒息處決,美國阿拉巴馬州死囚史密斯伏法:「每個人都說我會受苦」
- 演节目 秀梦想 大人欢 娃娃乐
- 「民眾黨跑一票」的啟示:不管誰當院長,最大的還是柯建銘
- 随机阅读
-
- 台湾花莲县海域发生5.0级地震 震源深度20千米
- 用100招來「省錢」,不如學會一招明智的「花錢」!
- 沒有子女後事怎麼辦?夫妻保險提早規劃,無子女晚年生活有保障
- 黃婉玲《被誤解的老台菜》:油蔥醬可說是筒仔米糕的靈魂,關鍵在於爆油蔥的功力
- 环氧树脂修复水泥基材料微裂缝的渗透机理(二)
- 中國經濟疲軟,美國今年可望取而代之成為德國最大貿易夥伴
- 讀《彈性習慣》:具備選擇的自由,才能持續地自律,讓自己成為習慣的常勝軍
- 波蘭新總理圖斯克不僅想修補與烏克蘭關係,還有另一層更高的戰略布局
- 聚焦《消费者权益保护法实施条例》
- LINE Pay登錄興櫃首日飆漲近2倍,躍升台股第12檔千金股
- 研究:20年來全球71%地下水位呈下降趨勢,為何部分地區卻「不降反升」?
- 國科會專區2023 BIO Asia亞洲生技展 盛大開展
- 双孢蘑菇液体菌种发酵及栽培效果浅析
- 2023迎向雲端浪潮,掌握職場躍進方程式,培養雲端硬實力就在此刻!
- 《用能量創造每一天的奇蹟》:我們能不能把每一天都當作是新年,用活在當下的感覺去過日子?
- 獲頒生涯第二座MVP!大谷翔平帥氣出席BBWAA晚宴,英語致詞感謝日本造就自己
- 固体废物的不同前处理分析测试对比(四)
- 謝淑薇賽前最後一刻決定搭檔波蘭選手傑林斯基,拿下大滿貫混雙生涯首冠
- VOLVO的綠色起源—別讓電動車外的美景,成為海洋生物的浩劫
- 績效出爐!《2222-未來選擇地》首個永續展覽活動導入 ISO 20121永續性活動管理系統,接軌國際標準
- 搜索
-
- 友情链接
-