📄 paper · by Wang et al. 2024

Mmlupro

2 mentions across 1 person

Visit ↗

All mentions

Ethan Mollick

paper · 2026-04-17

Recommended

“We evaluate model performance on GPQA (Rein et al. 2024) and MMLU-Pro (Wang et al. 2024)”

Prompting LLMs with Threats or Tips Shows Limited Efficacy ↗

Ethan Mollick

paper · 2026-04-17

Recommended

“We study both domain-specific expert personas and low-knowledge personas, evaluating six models on GPQA Diamond (Rein et al. 2024) and MMLU-Pro (Wang et al. 2024), graduate-level questions spanning science, engineering, and law.”

Persona Prompting Fails to Improve LLM Factual Accuracy ↗