12GB 实现 128K 上下文 5 会话,IBM 预览 Granite 4.0 Tiny 模型 5月10日消息,IBM本月2日介绍了其Granite4.0系列模型中的最小版本之一:Granite4.0Tiny的预览版本。Granite4.0TinyPreview的优势在于高计算效率和低内存需求:在FP8精度下,运行5个128KB上下文窗口的并发对话仅需12GB显存,一张建议零售价329美元(注...