広場
最新
注目
ニュース
プロフィール
ポスト
DappDominator
2025-07-27 11:53:24
今、これが推論においてどのように意味を持つかというと、私たちはH200上で量子化されたQ8 Qwen Coder 3とKimi K2インスタンスをかろうじて収めました。Kimi K2 @ Q8はコンテキストのためのkvキャッシュの余地を全く残しませんでした。これらのモデルは単一の8xB200インスタンスに収まるでしょうか?おそらく、今週試してみます。
LL
0.77%
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については
免責事項
をご覧ください。
16 いいね
報酬
16
4
共有
コメント
0/400
コメント
NonFungibleDegen
· 2時間前
このスペックではngmiです、本当に。
原文表示
返信
0
FlippedSignal
· 2時間前
このQ8はあまりにもゴミですね
原文表示
返信
0
NotGonnaMakeIt
· 2時間前
この最適化はダメだ、全然動かない。
原文表示
返信
0
WalletDoomsDay
· 2時間前
内蔵メモリ強制清算でしょう兄弟
原文表示
返信
0
トピック
1
/3
1
Simple Earn Annual Rate 24.4%
36k 人気度
2
Gate Launchpad List IKA
38k 人気度
3
ETH Trading Volume Surges
38k 人気度
4
Gate ETH 10th Anniversary Celebration
22k 人気度
5
Trump’s AI Strategy
18k 人気度
ピン
サイトマップ
今、これが推論においてどのように意味を持つかというと、私たちはH200上で量子化されたQ8 Qwen Coder 3とKimi K2インスタンスをかろうじて収めました。Kimi K2 @ Q8はコンテキストのためのkvキャッシュの余地を全く残しませんでした。これらのモデルは単一の8xB200インスタンスに収まるでしょうか?おそらく、今週試してみます。