新しいオープンウェイトのLLM、ベンチマークのスコアは派手だけど実際に長文の要約をやらせると途中で文脈を落とす。リーダーボードの数字だけ見て導入を決めるのは本当に危険だと思う。 #ai #technology