Press release

Eine Forschungsarbeit von COGNANO mit Co-Autoren von Google über einen großen Datensatz von Antigen-Antikörper-Interaktionen wurde von NeurIPS 2023 angenommen

0
Präsentiert von Businesswire

Antikörper sind die wichtigste therapeutische Modalität in der Arzneimittelforschung, denn es gibt keine Substanz, die so präzise und stark an Zielmoleküle (Antigene) bindet wie Antikörper. Lebende Organismen können eine riesige Vielfalt von Antikörpern, die von Genen abgeleitet sind, in nahezu unbegrenzter Menge produzieren – und zwar in einem solchen Ausmaß, dass es theoretisch möglich ist, auf der Grundlage riesiger Sammlungen von Antikörper-kodierenden Genen in vivo nach wirksamen Antikörpern zu suchen. Allerdings ist es nicht einfach, diese zu entschlüsseln, und der Datenakkumulation sind aufgrund der komplizierten Gene Grenzen gesetzt.

Diese Pressemitteilung enthält multimediale Inhalte. Die vollständige Mitteilung hier ansehen: https://www.businesswire.com/news/home/20230927176061/de/

Website for downloading released dataset (https://avida-hil6.cognanous.com/) (Graphic: Business Wire)

Website for downloading released dataset (https://avida-hil6.cognanous.com/) (Graphic: Business Wire)

Durch die Immunisierung von Alpakas, die ein einfaches Antikörper-kodierendes Gen besitzen und daher eine breite Palette von Antikörpern produzieren können, erwarb COGNANO eine digitale “Bibliothek” von Antikörpersequenzen und deren Bindungsaktivität an verschiedene Antigene. Im Allgemeinen ist die Bindung zwischen einem Antikörper und einem Antigen eine Eins-zu-eins-Entsprechung, und es gibt nur eine Bindungsstelle (das so genannte Epitop). Wir zeigen mit diesem Datensatz, dass die künstliche Intelligenz das Potenzial besitzt, die Bindungsfähigkeit von bisher unbekannten Antikörpern vorherzusagen. Wir stellen diesen Datensatz der Forschungsgemeinschaft als den weltweit größten und präzisesten Antigen/Antikörper-Datensatz zur Verfügung, in der Hoffnung, dass er den Fortschritt in der KI-gestützten Arzneimittelentdeckung beschleunigt.

Wir hoffen, dass künftige Arbeiten nicht nur die Möglichkeit der Vorhersage von Bindungen, sondern auch die Identifizierung von Epitopen und der verantwortlichen Aminosäuresequenzen in Antigenen und Antikörpern untersuchen werden. Wir glauben, dass dies ein wichtiger Schritt vorwärts in der automatischen Arzneimittelentdeckung ist. COGNANO wird diese Leistung auf der NeurIPS 2023 in Zusammenarbeit mit dem Google-Team vorstellen.

Titel: AVIDa-hIL6: Ein groß angelegter VHH-Datensatz aus einem immunisierten Alpaka zur Vorhersage von Antigen-Antikörper-Interaktionen

Autoren: Hirofumi Tsuruta, Hiroyuki Yamazaki, Ryota Maeda, Ryotaro Tamura, Jennifer N. Wei, Zelda Mariet, Poomarin Phloyphisut, Hidetoshi Shimokawa, Joseph R. Ledsam, Lucy Colwell, Akihiro Imura

URL: https://arxiv.org/abs/2306.03329

1. Hintergrund

Antikörper sind Proteine, die eine wesentliche Rolle im Immunsystem spielen. Aufgrund ihrer hohen Zielspezifität und Bindungsaffinität sind Antikörper zu einer wichtigen Klasse von Therapeutika zur Behandlung menschlicher Krankheiten geworden. Um die Entdeckung therapeutischer Antikörper zu beschleunigen, sind computergestützte Methoden, insbesondere das maschinelle Lernen, zur Vorhersage spezifischer Wechselwirkungen zwischen Antikörperkandidaten und Zielantigenen wie Viren und Bakterien auf großes Interesse gestoßen. Die Fortschritte bei der Entdeckung therapeutischer Antikörper sind jedoch hinter den Fortschritten in anderen Bereichen der Arzneimittelentdeckung zurückgeblieben, da es an qualitativ hochwertigen, groß angelegten Datensätzen zu Antigen-Antikörper-Interaktionen mangelt. Insbesondere die öffentlich zugänglichen Datensätze bestehender Studien weisen beträchtliche Einschränkungen auf, wie z. B. die geringe Größe und das Fehlen von nicht bindenden Proben und genauen Aminosäuresequenzen. Daher sind groß angelegte Datensätze, die die Einschränkungen bestehender Datensätze überwinden, von entscheidender Bedeutung, um die Entdeckung von KI-Wirkstoffen weiter zu beschleunigen.

2. Forschungsbeiträge

  • Wir veröffentlichen AVIDa-hIL6, den größten existierenden Datensatz für die Vorhersage von Antigen-Antikörper-Interaktionen (10-mal umfangreicher als jeder andere öffentliche Datensatz), der Aminosäuresequenzen von Antigenen und Antikörpern sowie binäre Markierungen für bindende und nicht-bindende Paare enthält.

  • Wir haben eine neuartige Methode zur Datengenerierung entwickelt, die das Immunsystem eines lebenden Alpakas nutzt. Da unsere Datengenerierungsmethode auf jedes beliebige Zielantigen anwendbar ist, kann sie eine grundlegende Technologie für die Erstellung einer umfassenderen Datenbank für Antigen-Antikörper-Interaktionen sein. Tatsächlich haben wir den gleichen Ansatz verwendet, um einen Datensatz für SARS-CoV-2-Varianten zu erstellen und erfolgreich wirksame Antikörper zu finden.

Referenzdokument: https://www.nature.com/articles/s42003-022-03630-3

  • Wir berichten über experimentelle Benchmark-Ergebnisse zu AVIDa-hIL6 unter Verwendung von Modellen des maschinellen Lernens. Diese Ergebnisse bestätigen, dass AVIDa-hIL6 wertvolle Benchmarks für die Forschung im Bereich des maschinellen Lernens auf dem wachsenden Gebiet der Vorhersage von Antigen-Antikörper-Interaktionen bietet.

3. Veröffentlichter Datensatz (AVIDa-hIL6)

AVIDa-hIL6 ist auf der Website (https://avida-hil6.cognanous.com) unter einer CC BY-NC 4.0-Lizenz verfügbar. AVIDa-hIL6 enthält Aminosäuresequenzen des menschlichen Interleukin-6 (IL-6)-Proteins, das als Antigen verwendet wird, sowie Antikörper und binäre Markierungen für bindende und nicht-bindende Paare.

Überdies enthält AVIDa-hIL6 Informationen über die Interaktion verschiedener Antikörper mit 30 verschiedenen Mutanten, die durch künstliche Punktmutationen erzeugt wurden, zusätzlich zum Wildtyp-IL-6-Protein. Dabei wird davon ausgegangen, dass Antigen-Mutanten nacheinander auftauchen, um dem Immunsystem zu entgehen, wie bei der COVID-19-Pandemie. AVIDa-hIL6 enthält viele sensitive Fälle, in denen Punktmutationen im IL-6-Protein die Antikörperbindung verstärken oder hemmen, was den Forschern wertvolle Erkenntnisse über die Auswirkungen von Antigenmutationen auf die Antikörperbindung liefert.

4. Perspektiven

Die größte Einschränkung von AVIDa-hIL6 ist die fehlende Antigenvielfalt: AVIDa-hIL6 hat nur das IL-6-Protein als Antigen. Diese Einschränkung führt zu einer begrenzten Anwendbarkeit eines auf AVIDa-hIL6 trainierten Modells. Tatsächlich ist es für ein maschinelles Lernmodell, das nur mit AVIDa-hIL6 trainiert wurde, schwierig, Antikörper vorherzusagen, die gegen andere Antigene als das IL-6-Protein wirksam sind. In der Arzneimittelforschung besteht jedoch die Notwendigkeit, wirksame Antikörper gegen neu entstehende Antigene zu finden.

Ein wesentlicher Ansatz zur Überwindung dieser Einschränkung besteht darin, markierte Daten für eine größere Vielfalt von Antigenen und deren Mutanten zu sammeln. Unsere Methode zur Datengenerierung hat den Vorteil, dass sie auf jedes Zielantigen anwendbar ist. In Zukunft planen wir, Datensätze für verschiedene Antigene zu erstellen und zu veröffentlichen, die für die Erstellung von Modellen zur Vorhersage von Antigen-Antikörper-Interaktionen praktischer sein sollten.

Die Ausgangssprache, in der der Originaltext veröffentlicht wird, ist die offizielle und autorisierte Version. Übersetzungen werden zur besseren Verständigung mitgeliefert. Nur die Sprachversion, die im Original veröffentlicht wurde, ist rechtsgültig. Gleichen Sie deshalb Übersetzungen mit der originalen Sprachversion der Veröffentlichung ab.