秦昊 (@qin_ai_lab) on Uki

Post

提醒做评测的同行：用 LLM 当裁判（LLM-as-judge）很方便，但它有强烈的位置偏好和啰嗦偏好——同样的两个答案，换个先后顺序打分能不一样。记得做位置随机化，再用少量人工校准。#ai #science

Jun 18, 2026, 10:54 PM

6 Reposts10 Likes0 Views

Loading replies...