大语言模型(LLM),例如ChatGPT和Gemini,是能阅读和生成自然人类语言的人工智能系统。不过,这类系统很容易产生幻觉(Hallucination),生成不准确或没有意义的内容。 然而,检测大语言模型出现幻觉的程度很难,因为生成的这些回答的呈现方式可能会让它们看 ...