今日实时汇率

1 美元(USD)=

7.1788 人民币(CNY)

反向汇率:1 CNY = 0.1393 USD   更新时间:2025-07-10 03:00:01

苹果芯跑大模型不用降计算精度,投机采样杀疯了,GPT-4也在用

来源:量子位

专攻代码的Code Llama一出,大家伙都盼着谁来后续量化瘦身一下,好在本地也能运行。

果然是llama.cpp作者Georgi Gerganov出手了,但他这回不按套路出牌:

不量化,就用FP16精度也让34B的Code LLama跑在苹果电脑上,推理速度超过每秒20个token。