综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2026年2月,初创公司Taalas推出首款芯片HC1,峰值推理速度达每秒17000个token,比现有最强竞品快10倍,同时成本降低20倍、功耗减少10倍,实现亚毫秒级响应。该芯片采用台积电N6工艺,面积815mm²,典型功耗仅250W,搭载Llama 3.1 8B模型,通过将模型直接刻在硅片上实现极致性能。团队由AMD前高管创立,仅24人,研发成本3000万美元,已获2亿美元投资。HC1因超低延迟被看好用于具身智能领域,但其硬编码设计可能使迭代受限。公司计划春季发布第二代产品,冬季上线HC2。
原文链接
在2025年人工智能计算大会上,浪潮信息发布元脑HC1000和元脑SD200两大AI服务器产品,显著优化智能体产业化中的速度与成本问题。元脑SD200将DeepSeek-R1模型推理延迟降至8.9ms,创造端到端推理新纪录,并实现超线性扩展率。元脑HC1000则将百万Token推理成本降至1元,单卡及系统成本分别降低60%和50%。两者通过创新架构设计,解决了通信延迟、资源利用率低等问题,为多智能体协同和复杂任务推理提供高效算力支持。浪潮信息首席AI战略官刘军指出,未来AI计算需从通用转向专用架构,以应对系统规模、电力压力和算效不平衡等挑战。
原文链接
加载更多
暂无内容