据财联社动静,国际电信联盟电信尺度(ITU-T)于 2025 年 3 月正式发布 ITU-T F。748。44 根本模子的评估尺度:基准测试/ Assessment criteria for foundation models! Benchmark。该项国际尺度由中国消息通信研究院牵头制定,规范了大模子基准测试的目标要乞降测试方式。拾掇:锦鲤。
OpenAI 颁布发表对 ChatGPT 进行严沉功能更新,显著扩展其定制和回忆能力。此次更新后,ChatGPT 可以或许记住之前所有对话消息,并据此调整答复,实现更个性化的交互,用户能够随便启用或禁用此功能。该功能目前率先向 ChatGPT Plus 和 Pro 用户推出。
手艺扭捏、文章凸显了苹果内部矛盾沉沉,现私立场、带领不力、团队冲突等问题。例如,苹果正在 Siri 后端开辟上扭捏不定,从最后设想建立“Mini Mouse” 取 “Mighty Mouse” 双模子,到决定采用单一狂言语模子(LLM),部门人员去职。
或成科技史最大种子轮据 Business Insider 报道,由前 OpenAI 首席手艺官 Mira Murati 创立的 Thinking Machines Lab 正寻求 20 亿美元的种子轮融资。若成功,这将成为科技史上规模最大的种子轮之一。当前,AI 行业成长态势备受争议,华尔街对 CoreWeave 的初次公开募股反映纷歧,微软也削减了部门 AI 根本设备项目。正在如许的布景下,若 Murati 的公司成功筹集 20 亿美元,将无力证明 AI 投资高潮照旧强劲。
据 TechCrunch 报道,一位菲律宾金融科技创始人遭到欺诈,其所推出的 AI 购物使用,本来操纵 AI 手艺为用户供给办事,却被发觉现实是菲律宾本地人工操做。这一欺诈行为曾经消费者,损害用户权益,该公司创始人将面对法令逃责。
宇树发布机械人 G1 拳击视频,正在视频中,G1 不只展现了打沙袋,还和成年须眉以及别的一台 G1 机械人别离进行了对打。虽然 G1 被人类一脚踢倒,但还能够单手撑地很快坐起来。视频结尾显示,他们将正在近 1 个月摆布机械人肉搏曲播。
据 The Verge 报道,OpenAI 打算下周发布一系列新的人工智能(AI)模子,此中包罗多模态模子 GPT-4o 的改良版——GPT-4。1,以及尺寸更小的 GPT-4。1 mini 和 nano 版本。同时发布 o3 完整版取 o4 迷你版。动静人士称,比来 OpenAI 因为产能问题延迟了一些新模子的推出,因而 GPT-4。1 的推出时间有可能比原定的下周要迟。此前,Altman 已提示用户新版本可能存正在办事延迟取解体。
OpenAI 开源了名为 BrowseComp 的新基准测试,旨正在权衡 agent 正在互联网上定位难找消息的能力。现有基准测试已不克不及很好地阐扬其感化,由于新的模子使测试成果达到了饱和形态,BrowseComp 通过让人类锻炼员建立极具挑和性、谜底简短且独一的问题来进行测试,涵盖多范畴从题。OpenAI 但愿通过开源 BrowseComp 鞭策更靠得住的 AI 研究。