KIT | KIT-Bibliothek | Impressum | Datenschutz

Advancing Solubility Prediction by Integrating Computational Models, Multi-Solvent Systems, and Sourced PubChem Data

Ali, Mushtaq ORCID iD icon 1
1 Institut für Biologische und Chemische Systeme (IBCS), Karlsruher Institut für Technologie (KIT)

Abstract:

Die Wasserlöslichkeit ist eine Schlüsseleigenschaft chemischer Verbindungen, die ihre potenziellen Anwendungen bestimmt, von der Arzneimittelentwicklung bis zur Materialwissenschaft. Um die aktuellen Methoden zur Vorhersage der Löslichkeit weiter zu verbessern, verfolgte ich drei sich ergänzende Ansätze: (1) Hinzufügen weiterer Daten und Darstellungen, (2) Verfeinerung der Modellentwicklung mit zusätzlichen Funktionen, (3) Erweiterung auf ein Mehr-Lösungsmittelsystem.
Im ersten Projekt wurde eine Hochdurchsatz-Pipeline entwickelt, um Löslichkeitsdaten aus der PubChem-Datenbank unter Verwendung von SMILES-Darstellungen (Simplified Molecular Input Line Entry System) zu extrahieren, zu bereinigen und zu validieren. ... mehr

Abstract (englisch):

Aqueous solubility is a key property of chemical compounds that determines their potential applications, from drug development to materials science. To further improve the current solubility prediction methods, we followed three complementary approaches: (1) added more data and representation, (2) refined model development with added features, and (3) expanded to a multi-solvent system.
In the first project, a high-throughput pipeline was developed to extract, clean, and validate solubility data from the PubChem database using SMILES (Simplified Molecular Input Line Entry System) representations. ... mehr


Volltext §
DOI: 10.5445/IR/1000192666
Veröffentlicht am 30.04.2026
Cover der Publikation
Zugehörige Institution(en) am KIT Institut für Biologische und Chemische Systeme (IBCS)
Institut für Organische Chemie (IOC)
Institut für Theoretische Informatik (ITI)
Publikationstyp Hochschulschrift
Publikationsdatum 30.04.2026
Sprache Englisch
Identifikator KITopen-ID: 1000192666
Verlag Karlsruher Institut für Technologie (KIT)
Umfang 113 S.
Art der Arbeit Dissertation
Fakultät Fakultät für Chemie und Biowissenschaften (CHEM-BIO)
Institut Institut für Biologische und Chemische Systeme (IBCS)
Prüfungsdatum 05.05.2025
Bemerkung zur Veröffentlichung Manuscript in preparation on large-scale aqueous and multi-solvent solubility prediction using machine learning and PubChem data
Schlagwörter Aqueous Solubility, Multi-Solvent Solubility Prediction, Chemical Informatics (Cheminformatics),, Molecular Property Prediction, SMILES Representation, Thermodynamic Properties, Structure–Property Relationships
Referent/Betreuer Bräse, Stefan
Friederich, Pascal
KIT – Die Universität in der Helmholtz-Gemeinschaft
KITopen Landing Page