vfa-Faktencheck zur IQWiG-Analyse der Bewertungsmethodik für Arzneimittel
Die Analyse des IQWiG ist eine verpasste Chance, sich einer vollwertigen Evaluation der eigenen Ausmaßmethodik zu stellen. Die Ergebnisse zeigen, dass die Methode in Teilen zu konservativ ist und vor allem seltene Erkrankungen benachteiligt. Dies darf nicht unter den Tisch gekehrt werden und obendrauf zu einer verschärften Anwendung der AMNOG-Leitplanken führen. Eine offene wissenschaftliche Auseinandersetzung ist dringend geboten.
Hintergrund
Das IQWiG hat am 26.11.2024 sein Arbeitspapier mit dem Titel „Ausmaßmethodik Zusatznutzen – Empirie aus Dossierbewertungen“ veröffentlicht. Es handelt sich um die Untersuchung der eigenen Methodik, die das Institut im Jahr 2011 zum Beginn des AMNOG-Verfahrens konzipiert hat und seitdem zur Bewertung neuer Arzneimittel anwendet. Darin untersucht das Institut anhand der zurückliegenden Nutzenbewertungen, ob die beobachteten Studieneffekte den eigenen Erwartungen entsprechen.
Der Methodenvorschlag des IQWiG wird zwar seit nun 13 Jahren vom Gemeinsamen Bundesauschuss (G-BA) nicht übernommen, dennoch können die darauf basierenden Empfehlungen des Instituts die G-BA-Bewertungen stark beeinflussen und so u.a. über die Geltung der „AMNOG-Leitplanken“ entscheiden. Ebenso hat die Methodik einen Einfluss auf die vom IQWiG erstellten Gesundheitsinformationen zur Aufklärung der Öffentlichkeit. Der vfa hat sich mit der Analyse auseinandergesetzt und diese einem Faktencheck unterzogen.
1. Das IQWiG untersucht auf Basis der knapp 700 abgeschlossenen Nutzenbewertungen empirisch, inwieweit die von ihm erwarteten Effektgrößen erreicht werden konnten.
vfa-Check:
Der Analyse basiert auf einer breiten Grundlage der Bewertungen aus rund 10 Jahren. Zugleich ist die Analyse nur auf diese Empirie beschränkt und befasst sich nicht mit kritischen Grundannahmen. Warum ist das problematisch? Die Ausmaßmethodik des IQWiG ist ein Eigenkonstrukt, dessen Grundannahmen umstritten sind. So zum Beispiel die Wahl des zentralen Ankerpunkts für eine Durchbruchsinnovation anhand nur einer Publikation, die Setzung der Schwellenwerte oder die pauschale Annahme von zwei Studien über alle Therapiesituationen. So gleicht das Ergebnis eher einem Zirkelschluss und stellt keine vollwertige Evaluation der Methodik dar.
2. Für die höchsten Ausmaßkategorien des Zusatznutzens stuft das IQWiG mehr als die Hälfte der Effektschätzungen kleiner als erwartet ein. Für die übrigen Ausmaßkategorien seien die Effektschätzungen in den meisten Fällen größer als die Erwartungswerte.
vfa-Check:
Die Analyse verdeutlicht ganz im Gegenteil, dass für die höchsten Ausmaßkategorien (z.B. erheblich bei Mortalität) die beobachteten Effektschätzungen gut mit den erwarteten Effektgrößen übereinstimmen. Für die unteren Ausmaßkategorien zeigt sich aber, dass die Methode zu konservativ ist, so zum Beispiel die Anforderung für einen beträchtlichen Zusatznutzen bei Lebensqualität. Bedeutsame Therapieeffekte werden hier nicht gut gemessen oder gar nicht ernst als relevant anerkannt.
3. Das IQWiG identifiziert die Populationsgröße als Faktor, für den sich teilweise unterschiedliche Verteilungen der beobachteten Effektschätzungen zeigen.
vfa-Check:
Dieses Ergebnis ist erwartbar gewesen. Es zeigt empirisch, dass der „one size fits all“-Ansatz des IQWiG vor allem seltene Erkrankungen mit kleinen Patientenzahlen systematisch benachteiligen kann. Für das Erreichen eines bestimmten Zusatznutzens müssen für seltene Erkrankungen deutlich größere Effekte erzielt werden als für häufigere Erkrankungen.
4. Das IQWiG will eine mögliche Anpassung der Methodik auf die höchsten Ausmaßkategorien fokussieren.
vfa-Check:
Die Schlussfolgerung des IQWiG steht im Widerspruch zu den eigenen Ergebnissen. Gerade für die höchsten Ausmaßkategorien ist eine vorwiegend gute Übereinstimmung zwischen Empirie und Erwartung zu sehen. Eine mögliche Anpassung wäre stattdessen eher für die unteren Ausmaßkategorien und im Umgang mit seltenen Erkrankungen angebracht, wo die Methode sich als viel zu konservativ erwiesen hat. Das bleibt jedoch unbeachtet und wird nicht als Anlass zur Überarbeitung angesehen. Stattdessen wird eine Nachschärfung für höchste Ausmaßkategorien angeregt, die zu einer verschärften Anwendung der AMNOG-Leitplanken durch die Hintertür führen kann.