大模型让让,小模型登场丨科创要闻
4 月 23 日,大模登场微软推出小语言模型(SLM)Phi-3系列,型让有Phi-3-mini、模型Phi-3-small、丨科Phi-3-medium三个版本,创闻在评估语言、大模登场编程、型让数学能力等的模型基准测试中,Phi-3系列模型表现优于同等规模甚至更大规模模型(如GPT-3,丨科5)。微软称其是创闻目前同类中最强大且最具成本效益的小型语言模型。 Phi-3模型的大模登场“小体积”,让手机上运行高能力的型让语言模型成为可能。如Phi-3-mini只占用手机18GB内存,模型如在iPhone 14上部署,丨科苹果的创闻A16仿生芯片在设备上脱机运行,可以实现每秒超过12个token。 自2022年12月ChatGPT爆火之后,科技公司们一头扎进了大型模型的竞争,2023年接连刷新模型参数,2024年开始“内卷”长文本。大家似乎默认数据越多、参数越大、算力越强,模型的能力越强。 但是,高昂的运行成本、具体场景模型调试难度等问题,让大模型商业化的路径慢下来。此时小模型的优势就体现出来了。 小模型,目前某些领域也能接近大模型的性能。特别是在各手机和PC厂商正在力推的AIPC、AI手机上,对设备计算能力、运行能力、储存能力要求较低,能在地化运行的小模型,的确是不错的选择。 其实早在2023年6月份,微软就发布了第一代Phi模型,Phi-3系列已经是其第四代产品。近期,苹果公司也凑了小模型的热闹。 2024年4月24日,在大模型上没有什么动静的苹果公司,发布开源小语言模型OpenELM,包括
-
上一篇
-
下一篇
- 最近发表
-
- (有片)西班牙滑雪場突發纜車意外 至少30傷
- 紅色高棉政權下的倖存者,全美首位柬埔寨裔市長Sokhary Chau宣布就職
- 店家規定「低消一杯飲料」,作家陳安儀質疑「點千元餐不算?」引發討論
- 《世界戰爭圖鑑》:若想瞭解前蘇聯部隊的軍紀有多麼低落,最好的例子莫過於1994年開始的車臣戰爭
- 以軍襲擊加沙北部又一大型醫院 已造成至少12人死亡
- 《星際先鋒》:「純氧環境易燃」算是普通常識,NASA怎麼會犯下如此愚蠢的錯誤?
- 【TNL本週沙龍議題】酒駕事件層出不窮,你怎麼看交通部提出的修法方向?
- 《國體法》部分條文修正:立院三讀通過「麟洋條款」,運動選手具公務員身份也可接商業代言
- 伟业计量头条:尿素氮溶液标准物质有国标号啦!
- 《這樣想事情,你會找到自己喜歡的工作》:三個方法保持「高意識」、別和自我評價低的人深交
- 随机阅读
-
- 韓國「世越」號救援不力案 9人被判無罪
- 「不希望變政黨對決」:朱立倫呼籲中二補選總動員催票、林昶佐罷免則尊重在地選擇
- 《當死者說話時》後記:與死者打交道真的改變了我的視野,而且都是正面的改變
- 國軍官兵BMI超標,國防部指將持續進行減重門診,立委:只汰除官兵、加強操練不能解決問題
- 电感耦合等离子体质谱法测定阿莫西林原料药中的7种杂质元素(二)
- 「不希望變政黨對決」:朱立倫呼籲中二補選總動員催票、林昶佐罷免則尊重在地選擇
- 全球海運集團掀整併潮解決供應鏈危機,「貨櫃清道夫」成塞港新商機
- 【書評】《研之有物》:比大學更「象牙塔」的中研院,其實充滿浪漫的科學情懷
- 「新品推荐」BNCC最新细菌DNA标准品火热来袭,欢迎咨询!
- 那些經歷過的千山萬水,都是為了此刻站在你的面前、站在愛的面前
- 如何善用顏色、粗體等各種「標記功能」來強化學術文章的內容?
- 《膽小別看畫Ⅱ》:某人的地面正是其他人的牆壁,我們就這樣成了M.C.艾雪筆下魔法的俘虜
- 巴黎残奥会 突破自我 中国残奥游泳队再创佳绩
- 遲到1分鐘,民進黨已自行推選修憲委員會主席,國民黨憤而退席:你們自己爽就好了!
- Taylor Swift as Books:除了創作音樂,泰勒絲還能推廣文學閱讀?
- 《後來,我告了報社老闆》:編輯總部的鼠輩最讓人不悅的部分是,他們竟然幫助競爭對手
- 中秋国庆假期首日火车票今天开抢,12306提醒候补订单成功率高
- 我仔細思考過海鮮的來源後,決定開始自己潛水打魚
- 達思智能科技宣布推出為媒體產業打造的CDP平台產品DaEX for Publisher,並邀請資深創投林益全與資深媒體人王文靜加入董事會
- 台灣飲料封口演化論:為什麼紙吸管總是插不進去,但塑膠吸管就可以?
- 搜索
-
- 友情链接
-