大模型让让,小模型登场丨科创要闻
4 月 23 日,大模登场微软推出小语言模型(SLM)Phi-3系列,型让有Phi-3-mini、模型Phi-3-small、丨科Phi-3-medium三个版本,创闻在评估语言、大模登场编程、型让数学能力等的模型基准测试中,Phi-3系列模型表现优于同等规模甚至更大规模模型(如GPT-3,丨科5)。微软称其是创闻目前同类中最强大且最具成本效益的小型语言模型。 Phi-3模型的大模登场“小体积”,让手机上运行高能力的型让语言模型成为可能。如Phi-3-mini只占用手机18GB内存,模型如在iPhone 14上部署,丨科苹果的创闻A16仿生芯片在设备上脱机运行,可以实现每秒超过12个token。 自2022年12月ChatGPT爆火之后,科技公司们一头扎进了大型模型的竞争,2023年接连刷新模型参数,2024年开始“内卷”长文本。大家似乎默认数据越多、参数越大、算力越强,模型的能力越强。 但是,高昂的运行成本、具体场景模型调试难度等问题,让大模型商业化的路径慢下来。此时小模型的优势就体现出来了。 小模型,目前某些领域也能接近大模型的性能。特别是在各手机和PC厂商正在力推的AIPC、AI手机上,对设备计算能力、运行能力、储存能力要求较低,能在地化运行的小模型,的确是不错的选择。 其实早在2023年6月份,微软就发布了第一代Phi模型,Phi-3系列已经是其第四代产品。近期,苹果公司也凑了小模型的热闹。 2024年4月24日,在大模型上没有什么动静的苹果公司,发布开源小语言模型OpenELM,包括
- 最近发表
- 随机阅读
-
- 空谷数字体验平台(KXP)助力出海企业建站
- 蘿蔔料理兵法全攻略(一):採買如何避免挑到「花心大蘿蔔」?
- 【參與式前瞻】總論:讓我們用參與式前瞻,窺看2050年人類社會的面貌
- 疫情、缺水、停電後,誰還在乎就業與經濟成長?
- 中国古代循环农业模式与特征(三)
- 「工作知能法」把興趣當成最佳學習,非常符合108課綱的素養導向
- 日本創成會議報告(中):創建「全球化都市」失敗的日本,學到哪些教訓?
- 【小說】《深夜的電話》:我想調查一些地方,讓我外借這顆顱骨一週吧
- 中国救援队在土成功参与营救一名孕妇
- Édouard Manet:由神女到妓女的祼體,如何得到解放?
- 外國人最愛&最恨的台灣夜市美食:刈包、蚵仔煎、大腸麵線的英文怎麼說?
- 維多利亞時期小說與電影的敘事交會(上):當瑪莉雪萊腦中怪物成為眼前的魅影
- 二氧化钛溶液标准物质:高品质标准品助力科研分析
- 《你不該為創業受的苦!》:僱傭、委任、承攬、派遣,員工的四種契約型態有何不同?
- 【TIDF專訪】《恍惚與凝視的練習》導演陳芯宜:揉合自身夢境與家族故事的魔幻短篇
- 因疫情停課在家學習,如何為孩子挑選第一台筆電?
- 浙江台州发出首张个体工商户直接变更经营者营业执照
- 《主婦的斜槓人生》:專注,就是最好的時間管理法
- 結衣結婚了,新郎不是你——就讓他倆治癒彼此吧
- G7聲明確認台海議題多邊化,以及英國「全球不列顛」外交的印太角色
- 搜索
-
- 友情链接
-