Abstract:
Biotechnologische Fortschritte haben die Verwendung von therapeutischen Medikamenten grundlegend verändert. Zuvor beruhten Medikamente auf kleinen, chemischen Molekülen, nun sind größere, biologische, proteinbasierte Medikamente in den Vordergrund gerückt. Biologische Moleküle weisen eine verbesserte Rezeptor-Spezifität auf, sodass wirksame Medikamente gegen zuvor schlecht behandelbare Krankheiten entwickelt werden konnten. Dies wirkt sich auch auf die Produktionsprozesse aus, da biopharmazeutische Produkte in lebenden Wirtszellen exprimiert und in Bioreaktoren im größeren Maßstab hergestellt werden. ... mehrDieser Prozess wird als Upstream-Prozessierung (USP) bezeichnet. Während der Produktion enthalten die Prozesslösung neben dem gewünschten Zielmolekül verschiedene Verunreinigungen, wie z.B. Zellmetabolite, Nukleinsäuren, Wirtszellproteine (host cell proteins, HCPs) und Bestandteile des Zellkulturmediums. Diese müssen in der Downstream-Prozessierung (DSP) entfernt werden, um eine hohe Reinheit des Produktes und die Patientensicherheit zu gewährleisten. Fortschritte in der USP erzielten ein optimiertes Zellwachstum oder Zellmetabolismus sowie höhere Produktausbeuten. Dadurch hat sich der Produktionsengpass von der USP zu der DSP verschoben. Häufig werden Chromatographieschritte als Standard-DSP-Schritte in der biopharmazeutischen Industrie gewählt, da diese Schritte höchst selektiv sind und eine hohe Reinheit erzielen. Diese Schritte haben jedoch wirtschaftliche Nachteile, da die Chromatographie-Harze teuer sind, die Kapazität und die Fähigkeit die Harze zu regenerieren begrenzt sind. Um die erhöhte Produktausbeute in der USP zu bewältigen, müssen daher neue, kostengünstige Alternativen für Aufreinigungsprozesse verwendet werden.
Die Proteinkristallisation ist ein alternativer DSP-Schritt, der sowohl in der akademischen Forschung zur Analyse von Proteinstrukturen als auch in der Industrie für die Produktion oder Formulierung von Insulin bereits untersucht wurde. Moleküle ordnen sich wegen der nicht-kovalenten Wechselwirkungen in einer Kristallstruktur an, wenn geeignete Prozessparameter, z.B. pH-Wert oder Temperatur in der Prozesslösung eingestellt sind. Gerade die hohe Kristallreinheit und die Produktausbeute machen die Kristallisation zu einem geeigneten Schritt für die DSP. Zusätzlich bewirken Innovationen im Bereich des Protein-Engineerings eine verbesserte Kristallisierbarkeit, wodurch eine breitere Anwendung der Proteinkristallisation als effizienter Aufreinigungsschritt in der Industrie möglich wäre. Eine weitere DSP-Alternative ist die Proteinfällung, bei der Proteine aus komplexen Prozesslösungen zu amorphem, unstrukturiertem Niederschlag aggregieren. Bei der Prozessentwicklung der genannten DSP-Alternativen werden häufig ressourcenschonende, empirische Hochdurchsatz-Screenings durchgeführt, die wiederum schnelle und zuverlässige Analytik benötigen. Diese Methoden können genutzt werden, um Forderungen der US-amerikanischen Behörde Food and Drug Administration (FDA) nach Prozessanalytischer Technologie (process analytical technology, PAT) in der pharmazeutischen Produktion zu erfüllen. Laut dem Leitlinie Quality by Design (QbD) muss Qualität in die Prozessentwicklung integriert werden, um die Produktqualität zu sichern. Durch die Implementierung von PAT kann ein Prozess mit einer erhöhten Produktqualität entwickelt, überwacht und kontrolliert werden, indem kritische Qualitätsattribute (critical quality attributes, CQAs) gemessen und kritische Prozessparameter (critical process parameters, CPPs) gesteuert werden. Hierfür wird in der akademischen oder industriellen Forschung häufig multivariate, nicht-invasive Spektroskopie verwendet, da die gemessenen Spektren molekulare und strukturelle Informationen auf unterschiedlichen Ebenen über die Moleküle in der Prozesslösung enthalten und damit CQAs bestimmen können. In einem weiteren Schritt werden die multivariaten Spektren mithilfe von chemometrischen Methoden ausgewertet, um wichtige Informationen zu extrahieren und Muster in den biochemischen Systemen zu erkennen. Die Entwicklung neuartiger, biologischer Produkte, wie z.B. virusartige Partikel (virus-like particles, VLPs), monoklonalen Antikörpern (monoclonal antibodies, mAbs) und seine Varianten, Antikörper-Wirkstoff-Konjugate (antibody-drug conjugates, ADCs), Gen- oder Zelltherapeutika, erfordert zusätzlich anpassungsfähige, moderne Techniken der Prozessentwicklung. Tiefes Prozesswissen und Strategien zur Prozessüberwachung oder Prozessregelung können sich hier als nützlich erweisen. In Konsequenz müssen PAT-Werkzeuge so entwickelt werden, dass die Eigenschaften der neuen Medikamentenklasse berücksichtigt werden und im Idealfall bereits generiertes Prozesswissen auf neue Medikamente übertragen werden kann. Bisher konzentrierte sich die Entwicklung von PAT trotz der hohen Kosten, der schwierigen Skalierung oder des geringen, volumetrischen Durchsatzes auf die Chromatographie. PAT für alternative DSP-Schritte wurde jedoch nicht ausgiebig untersucht.
Daher war es das Ziel dieser Arbeit, neue PAT Analytik für Proteinkristallisationsprozesse zu entwickeln, die auf verschiedene, biologische Produkte angewendet werden können. Jegliche Analytik basierte auf multivariater Spektroskopie und Chemometrie. Diese Arbeit beschäftigte sich mit der Entwicklung von PAT für die Proteinkristallisation in drei Studien: (I) die Entwicklung einer hochdurchsatzfähigen Analytik für Screenings von Modellproteinmischungen mithilfe von Regressionsmodellierung und Kalibrierungsproben, (II) die Untersuchung eines kalibrierungsfreien Ansatz für Analytik in Screenings verschiedener, biologischer Produkte in komplexen Prozesslösungen und (III) der experimentelle PAT-Aufbau zur Überwachung der Kristallisation in komplexem Lysat im größeren Maßstab. Die verschiedenen Studien zeigten, dass das Zielmolekül in jeder Studie im Mikro- und Labormaßstab trotz der Komplexität durch heterogenes, biologisches Material in der Kristallsuspension quantifiziert werden konnte.
In Kapitel 1 werden die für diese Thesis relevanten Grundlagen zur Herstellung von biopharmazeutischen oder biotechnologischen Produkten, zur Analytik und Sensortechnik sowie zur Datenauswertung beschrieben. Dabei behandeln die Kapitel detaillierter das Phasenverhalten von Proteinen, die Einflussfaktoren und die Visualisierung in Phasendiagrammen mit Fokus auf der Proteinkristallisation für DSP. Die im Rahmen dieser Arbeit verwendeten Spektroskopiearten -- die ultraviolett-sichtbares Licht (UV/Vis)- und Raman-Spektroskopie -- werden hinsichtlich ihrer Fähigkeit zur Proteinanalyse erläutert. Techniken der multivariaten Datenanalyse (multi-variate data analysis, MVDA) werden hinsichtlich multivariaten Spektren in biochemischen Systemen erklärt. Zuletzt werden die Vorteile des Einsatzes von PAT in biopharmazeutischen oder biotechnologischen Prozessen unter der Verwendung der beschriebenen Methoden beschrieben. Hierfür wird die Beziehung von PAT zum Konzept QbD, zu CQAs und CPPs herausgestellt. Aktuelle Forschungsergebnisse sind in jedem Abschnitt mit Fokus auf ihre Anwendung in DSP und Proteinkristallisation aufgelistet und beschrieben.
Bei der Entwicklung von Proteinkristallisationsprozessen müssen mehrere Faktoren berücksichtigt werden, wie z.B. der pH-Wert, Temperatur, Proteinkonzentration, und Konzentration des Fällungsmittels. Diese einstellbaren Parameter beeinflussen den Kristallisationsprozess hinsichtlich Prozess- und Produktcharakteristika, z.B. die Kristallisationsdauer, Kristallausbeute und -reinheit. Aufgrund der geringen Verfügbarkeit von Produktmaterial während der Prozessentwicklung werden in der Regel verschiedene Prozessbedingungen in empirischen Hochdurchsatz-Screenings mit minimalem Produktverbrauch getestet. Infolgedessen fallen viele, zu analysierende Proben an, die von neuer, schneller und hochdurchsatzfähiger Analytik profitieren können. Idealerweise lassen sich diese Methoden flexibel auf unterschiedliche Kristallisationsstudien anwenden. Häufig werden in Kristallisationsstudien die Kristallgrößenverteilung oder Kristallstrukturcharakteristika qualitativ bestimmt. Wenn die Proteinkristallisation jedoch als Aufreinigungsschritt verwendet werden soll, ist die Quantifizierung des Zielmoleküls entscheidend, da damit die CQAs Kristallreinheit und -ausbeute berechnet werden können. Die Quantifizierung gestaltet sich als schwierig, da die Prozesslösungen im DSP viele Kontaminanten enthalten. Daher wurde in Kapitel 3 eine schnelle, quantitative Analytik für Hochdurchsatz-Kristallisationsscreenings von Mischungen von Modellproteinen (Lysozym, Ribonuklease A und Cytochrom C) entwickelt. Hierbei wurde Lysozym als Zielmolekül behandelt und die beiden anderen Modellproteine als Verunreinigungen. Auf Basis von UV/Vis-Spektroskopie und einem chemometrischen Regressionsmodell der partiellen kleinsten Quadrate (partial least squares, PLS) sollte die Konzentration jedes Protein in den untersuchten Kristallisationsüberstand gemessen werden. Pro Protein wurde ein PLS-Modell erstellt, indem die aufgezeichneten UV/Vis-Spektren und die Referenkonzentrationen aus der Kationenaustauschchromatographie (cation-exchange chromatography, CEX) von Mischungen der drei Modellproteine für die Modellkalibrierung verwendet wurden. Im Anschluss wurden die Modelle in Screenings mit variierter Salzkonzentration, Proteinkonzentration und pH-Wert angewendet, um die breite Anwendbarkeit der Methode trotz Unterschieden in der wässrigen Umgebung der Proteine zu demonstrieren. Schließlich wurden zwei ausgewählte Screening-Bedingungen in einer kinetischen Studie mit Probenahmen über die Zeit untersucht, um die Übertragbarkeit der generierten Modell auf weitere Kristallisationsstudien zu zeigen. Die PLS-Modelle erzielten während der Kalibrierung, des Kristallisationsscreenings und der kinetischen Studie eine hohe Genauigkeit. In Abhängigkeit des pH-Wertes und der Salzkonzentration konnten die Sättigungskonzentration des Zielproteins und damit die Kristallausbeute und -reinheit bestimmt werden. Die Visualisierung der Ergebnisse in Phasendiagrammen erleichterte die Auswahl optimaler Kristallisationsbedingungen. In diesem Kapitel konnte eine neu entwickelte, schnelle Hochdurchsatz-Analytik auf Basis von chemometrischen Modellen und ressourcenschonender UV/Vis-Spektroskopie auf verschiedene Kristallisationsstudien angewendet werden, um Proteine in Mischungen spezifisch zu quantifizieren.
Die Entwicklung neuer, biologischer Produkte erfordert die schnelle Anpassung von Abläufen in der Prozessentwicklung, um den Patienten das Zielmolekül in hoher Qualität bereitzustellen. Prozessentwicklung auf Basis von Phasenverhalten kann eine Lösung darstellen, da diese alternativen DSP-Schritte eine hohe Produktivität erzielen können, während die Kosten niedrig bleiben. Für die Entwicklung solcher Prozessalternativen, wie z.B. die Proteinkristallisation oder -fällung, werden viele, unterschiedliche Prozessbedingungen getestet. Hochdurchsatz-Screenings und -analytik müssen daher schnell auf neue Molekül- oder Produktklassen übertragen und angewendet werden. Beim Einsatz von multivariaten Sensoren werden große, interkorrelierte Datensätze generiert, die in jeder Messdimension, z.B. Zeit, Wellenlänge und Probennummer, strukturiert werden können. Die erhöhte Dimensionalität der Daten erfordert neue Techniken der MVDA. Die parallele Faktoranalyse (parallel factor analysis, PARAFAC) ist eine solche multi-dimensionale, chemometrische Methode, die aus stark überlappenden Spektren den Beitrag der einzelnen Spezies zum Gesamtspektrum hinsichtlich jeder Dimension berechnen kann. Ohne eine umfangreiche Kalibrierung können die berechneten Modelle Prozesswissen wie die Lösungszusammensetzung oder reine Komponentenspektren bereitstellen. Das ist besonders hilfreich, wenn eine quantitative Konzentrationsanalytik oder Reinlösungen der einzelnen Komponenten nicht verfügbar sind. Die Anwendung von PARAFAC-Modellen als kalibrierungsfreie Analytik für Screenings von Phasenverhalten wird in Kapitel 4 beschrieben. In drei Hochdurchsatz-Screenings wurden verschiedene, biologische Produkte in chemisch definierten oder komplexen Prozessflüssigkeiten kristallisiert oder gefällt. Hierfür wurden Überstandsproben während der Kristallisation oder Fällung, den Waschschritten und der Rücklösung spektroskopisch untersucht. Die erste Studie nutzte die Daten des Kristallisationsscreenings aus Kapitel 3, um zu zeigen, dass PARAFAC-Modelle die Lösungszusammensetzung von Proteingemischen bestimmen können. In der ersten Studie konnte das Modell die Überstandskonzentration und zwei Komponentenspektren - des Zielmoleküls Lysozym und der Verunreinigungen als Mischung - abschätzen. Es konnten nur Spezies identifiziert werden, die zum Gesamtspektrum beitrugen und unterschiedliches Phasenverhalten aufwiesen. Spezies mit ähnlichem Phasenverhalten wurden als ein Proteincluster, bzw. als eine Spezies im Modell, behandelt. Quantitative CEX-Analytik und Reinspektren der Ausgangsproteine konnten zur Modellvalidierung verwendet werden. Die zweite und dritte Studie stellten realistische Szenarien in der Prozessentwicklung dar, da Zielmoleküle aus einer komplexen Prozesslösung aufgereinigt werden sollten. In der zweiten Studie wurden mAbs in Zellkulturüberstand (harvest cell culture fluid, HCCF) gefällt und Überstände von verschiedenen Prozessschritten während des Screenings wurden UV/Vis-spektroskopisch analysiert. Das erstellte PARAFAC-Modell konnte das Reinspektrum des mAb sowie die Konzentrationsänderungen des Zielmoleküls und anderer Kontaminanten in den Überstandsproben abschätzen. Im Anschluss wurde das Modell mit analytischer Protein-A-Chromatographie validiert. Die dritte Studie untersuchte die Fällung von VLPs in Escherichia coli (E.coli) Lysat. Die VLP-Studie wurde experimentell analog zur mAb-Studie durchgeführt, aber eine quantitative Referenzanalytik für die Konzentrationsbestimmung des Zielmoleküls stand nicht zur Verfügung. Die Erkenntnisse aus der ersten und zweiten Fallstudie in Bezug auf die Datenvorbereitung und Modellparameter konnten verwendet werden, um ein drittes VLP-Modell zu berechnen, das die VLP-Konzentration in den analysierten Überstandslösungen abschätzen konnte. Der qualitative Nachweis erfolgte mit Natriumdodecylsulfat-Polyacrylamidgel-Elektrophorese (SDS-PAGE), um anzuzeigen, ob Proteinspezies in den Überständen vorlagen. Zusätzlich konnte das VLP-Reinspektrum des Modells mit dem Spektrum einer aufgereinigten VLP-Probe verglichen werden. Multi-dimensionale PARAFAC-Modelle konnten flexibel auf multi-dimensionale UV/Vis-Spektren angewendet werden, um die jeweilige Proteinkonzentration und die Reinspektren abzuschätzen und um damit das Phasenverhalten von verschiedenen, biologischen Produkten zu untersuchen. Die datengetriebene Entwicklung von kalibrierungsfreien Modellen trägt dazu bei, dass alternative DSP-Schritte in Hochdurchsatz-Screenings von Proteinkristallisation und -fällung besser entwickelt werden können, insbesondere wenn viele Kontaminanten in komplexen Lösungen vorhanden sind.
In größeren Maßstäben können PAT-Sensoren in Produktionsprozesse eingebaut werden, um die Produktion und Produktqualität in Echtzeit zu überwachen. Für Chromatographie in der DSP ist der Einsatz von PAT weit verbreitet, um CQAs in komplexen Flüssigkeiten zu messen. Wenn Kristallisationsprozesse überwacht werden sollen, steht PAT aufgrund der Vielzahl an Störgrößen vor neuen Herausforderungen. Feste Kristalle, Kontaminanten in flüssiger oder potentiell ausgefällter Form und die heterogene, komplexe Prozesssuspension können die PAT-Sensoren beeinflussen. Zusätzlich können während der Kristallisation große Konzentrationsunterschiede in der Flüssigphase auftreten. Daher muss ein PAT-Sensoraufbau spezifisch auf die Anforderungen in Proteinkristallisationsprozessen in der DSP angepasst werden. Kapitel 5 beschreibt die Entwicklung eines solchen, angepassten PAT-Sensoraufbaus zur Überwachung von Proteinkristallisationsprozessen in komplexen Prozessflüssigkeiten im Labormaßstab. Der Aufbau bestand aus einer in situ Raman-Sonde im Kristallisationsgefäß, UV/Vis-On-line-Messungen mit einer Durchflusszelle mit variabler Pfadlängen-Technologie (variable pathlength, VP) in einem partikelfreien Bypass -- ermöglicht durch einen Querstromfiltration-Aufbau (cross-flow filtration, CFF) -- und zusätzlicher Analyse von Off-line-Proben. Letzteres wurde mit analytischer, immobilisierter Metallionenaffinitätschromatographie (immobilized metal ion affinity chromatography, IMAC), enzyme-linked immunosorbent assay (ELISA), SDS-PAGE und Fotomikroskopie untersucht, um jeweils die Konzentration des Zielmoleküls, den HCP-Gehalt, die Proteinreinheit und die Kristalle zu bewerten. Die Bildanalyse lieferte Informationen über die Kristallanzahl und Kristallgeometrie. Mit dem beschriebenen Aufbau an Analytik wurde die Proteinkristallisation von Lactobacillus kefir Alkoholdehydrogenase (LkADH) in geklärtem E.coli-Lysat überwacht und charakterisiert. Im 300 mL Maßstab wurden fünf Experimente durchgeführt, die sich in der Lyse-Prozedur, der Präzipitant-Konzentration und der Implementierung des partikelfreien Bypasses unterschieden. Die Raman-Sonde konnte trotz des Feststoffanteils in einer kristallinen Suspension In-line-Messungen der Flüssigphase durchführen. Auf Basis der vorverarbeiteten Raman-Spektren und Off-line-Konzentrationsmessungen des Proteins LkADH konnte ein PLS-Modell entwickelt werden und die Konzentration des Zielmoleküls im heterogenen Lysatüberstand in Echtzeit überwacht werden. Die Abnahme der vorhergesagten Überstandskonzentration deutete darauf hin, dass sich Proteinkristalle gebildet hatten. Die Auswertung der mikroskopischen Bilder der Off-line Proben bestätigte die Bildung von Proteinkristallen. Konzentrationsunterschiede zwischen dem Modell und den Referenzdaten waren bei erhöhter Zielkonzentration sichtbar, wenn das Modell direkt auf neue Experimente übertragen wurde. Mögliche Ursachen könnten Batch-to-Batch-Variationen und die durch die Lyse bedingt heterogene Zusammensetzung der Prozessflüssigkeit sein. Dank des partikelfreien Bypasses konnte auch partikelsensitve Analytik, wie z.B. die UV/Vis-Spektroskopie, angewendet werden. Die gemessene UV/Vis-Absorption gab qualitativ Aufschluss zum Nukleinsäure-Protein-Verhältnis und damit zur Reinheit. Die Flusszellentechnologie der VP reagierte schnell auf Veränderungen der Absorptionswerte, die in einem Kristallisationsprozess auftreten können. Zusätzlich konnte die Bildanalyse zur Kristallgeometrie zeigen, dass der CFF basierte Bypass keinen Kristallbruch verursachte. Darüber hinaus wurde in der Kristallisations- und Rücklösungsanalyse gezeigt, dass ein Experiment eine 2-log$_{10}$-Reduktion des HCP-Gehaltes erreichte. Ziel dieser Studie war die Entwicklung eines umfassenden PAT-Aufbaus mit unterschiedlichen Sensoren, angepasst an einen Proteinkristallisationsschritt in der DSP. Trotz gelöster oder ausgefällter Verunreinigungen konnte die Kombination aus Raman-Spektroskopie und Chemometrie die Konzentration des Zielmoleküls in einer komplexen Prozesssuspension mit mehreren Phasen bestimmen.
Auf Basis von multivariaten Spektren und Chemometrie bietet die vorgelegte Thesis daher vielversprechende, datengetriebene Analytik, angepasst an die Prozessentwicklung für Proteinkristallisation in der DSP. Auch wenn unterschiedliche, biologischen Produkte in Prozesslösungen mit variierendem Komplexitätsgrad untersucht wurden, konnten die entwickelten PAT-Methoden das Zielmolekül in jeder Studie quantifizieren und über mehrere Maßstäbe hinweg eingesetzt werden. Die Fortschritte regen dazu an, die etablierte Prozessentwicklung für biopharmazeutische Produkte neuzugestalten und ermöglichen eine flexiblere Entwicklung von DSP, basierend auf dem Phasenverhalten von Proteinen.
Abstract (englisch):
Biotechnological innovations have revolutionized the landscape of therapeutics, shifting from medication based on small, chemical molecules to larger, biological molecules, e.g. protein- based drugs. Thanks to the enhanced specificity of biological molecules to receptors, effective treatments could be developed to tackle so far unmet medical needs. Not only the drug specificity, but the production processes changed since these biopharmaceutical products are commonly expressed in living host cells and produced in bio-reactors. Along with the product harvest, these processes are defined as upstream processing (USP). ... mehrBesides the desired target molecule, the process liquid contains process- and product related impurities, e.g. cell metabolites, nucleic acids, host cell proteins (HCP s), or cell culture fluid compounds. This variety and the amount of impurities need to be depleted in several, consecutive downstream processing (DSP) steps to purify the product and to ensure the patients’ safety when the medication is administered. As advances in the USP have led to optimized cell growth or cell metabolism, and to higher product titers in the cell culture fluids, the production bottleneck moved from USP to DSP. Today, purification of therapeutics relies mainly on chromatography as the standard DSP step in the biopharmaceutical industry due to its high selectivity leading to high purity. Achieving this purity comes with economic challenges as the resins are expensive, limited in their capacity, and regenerative capability. Still, to respond to the increased product expression in USP cultivation, new, cost-effective process alternatives for purification processes need to be considered.
Protein crystallization is an alternative DSP step which has been researched in academia for protein structure analysis or industry for the production and formulation of insulin. The self-organization of molecules into a crystal structure is caused by non-covalent interactions and influenced by solution parameters, e.g. pH or temperature. This process comes with a high purity and product yield making it suitable for DSP. Recent advances in protein engineering to improve crystallizability promise a broader application of crystallization processes in the industry and elevate the potential of protein crystallization as an efficient purification step. As a second, alternative DSP step, protein precipitation has the potential to isolate proteins from complex feedstocks in amorphous, unstructured precipitate. Process design for the mentioned DSP alternatives often includes resource-saving, empirical high-throughput (HT) screenings, and thus, fast and reliable analytics. These methods can meet the needs for implementing more process analytical technology (PAT) tools by the U.S. Food and Drug Administration (FDA). According to the guiding principle quality by design (QbD), quality should be built into the process design to ensure a high product quality. PAT supports this superior goal by designing, monitoring and controlling processes with measurements of critical quality attributes (CQAs), and controlling critical process parameters (CPPs). For this purpose, academia and industry often employ multi-variate, non-destructive, spectroscopic sensors since the recorded spectra contain information about the molecules in the processed fluid on different structural levels, and thus, important CQAs. To analyze the multi-variate spectra, chemometric analysis applies mathematical or statistical methods to extract important information and identify patterns in biochemical systems. Additionally, the development of novel, biological products, e.g. virus-like particles (VLPs), monoclonal antibodies (mAbs) and their variants, antibody-drug conjugates (ADCs), gene or cell therapeutics, requires new process workflows, and thus, process design tools tailored to the new targets. Potential solutions to this issue can involve process design, based on process knowledge, and the implementation of process monitoring or process control strategies. As a result, PAT workflows need to be developed bearing the product characteristics in mind and showing the potential of transferring process knowledge to new modalities. In the past, PAT development in DSP focused on chromatographic separation while accepting the disadvantages, e.g. the high costs, the difficult scale-up, or the low volumetric throughput. However, the implementation of PAT in alternative DSP strategies has received less attention.
Therefore, the objective of this thesis was to develop data-driven PAT for protein crystallization processes which are applicable to various biological products. All analytics were based on multi-variate, spectroscopic measurements and chemometric analysis. Aiming to advance PAT for protein crystallization, this thesis presents (I) a HT-compatible, analytical workflow for screenings of model protein mixtures based on regression modeling with calibration samples, (II) a calibration-free approach for screenings of various modalities in complex feedstocks, and (III) a comprehensive PAT set-up to monitor crystallization in complex lysate on a larger scale. Demonstrated in diverse studies, the developed analytics could quantify the target molecule in heterogeneous, crystalline slurries across different scales from low-volume, HT screenings to lab-scaled crystallization vessels.
Chapter 1 describes the theoretical fundamentals relevant for this thesis regarding the production of biopharmaceutical or biotechnological products, spectroscopy, and data analysis. A special focus is laid on the phase behavior of proteins, protein crystallization for DSP , the influencing parameters, and forces leading to protein crystals or precipitate. Phase diagrams as a tool to visualize phase behavior of proteins are introduced. The spectroscopic techniques used for this thesis – ultraviolet-visible light (UV/Vis) and Raman spectroscopy – are elaborated in this chapter emphasizing their application to analyze proteins. The analysis of multi-variate spectra using multi-variate data analysis (MVDA) and its potential to interpret highly correlated, biochemical data sets are highlighted. Lastly, the advantages of PAT implementation in biopharmaceutical or biotechnological processes are explained, and the idea of QbD and its relation to important key parameters, e.g. CQAs and CPP s, are pointed out. The presented fundamentals are supported with current research in each section focusing on their application to DSP and protein crystallization.
When developing protein crystallization processes, multiple factors need to be considered, e.g. pH, temperature, protein concentration, precipitant concentration, which all influence the crystallization process, process time, yield, and purity. Since resources are scarce during process development of pharmaceutical products, low-volume, empirical HT screenings are popular and can test various different conditions. As a consequence, a large number of samples need to be analyzed, demanding fast, HT -compatible analytics that can be easily transferred to other crystallization studies. In general, most crystallization screening analytics focus on the qualitative assessment of the crystal size distribution, or the characterization of the crystals themselves. When protein crystallization is used for DSP, the concentration of the target molecule is crucial to calculate the CQAs crystal purity and yield, but the presence of impurities in DSP screenings complicates individual protein quantification. Therefore, Chapter 3 presents a rapid, quantitative, and HT-compatible analytical workflow for HT crystallization screenings of model protein mixtures (lysozyme, ribonuclease A, and cytochrome C). Here, lysozyme was treated as the target molecule and the two other model proteins as contaminants. The new analytical tool was based on UV/Vis spectroscopy and chemometric model development with partial least squares (PLS) regression models to quantify the proteins individually in the crystallization supernatant. As a proof of concept, three model proteins were mixed to calculate one PLS model per protein by regressing the recorded UV/Vis spectra to the reference concentrations from cation-exchange chromatography (CEX). The model was then applied to the analysis of supernatants in a protein crystallization screening to find optimal process conditions. The salt concentration, protein concentration, and pH were screened to show the broad applicability of the method to changes in the aqueous environment of the examined proteins. Finally, a kinetic study of two selected screening conditions was performed where samples were analyzed over time to show the transferability of the generated models to different, experimental set-ups. The PLS models showed high accuracy during calibration, the crystallization screening, and the kinetic study. The saturation concentration could be determined as a function of pH and the precipitant concentration, and the crystal yield and purity could be calculated. The results were visualized in a phase diagram to support selecting optimal crystallization conditions. In summary, the data-driven workflow demonstrated that chemometrics paired with low-volume, HT -compatible UV/Vis spectroscopy can be applied to different crystallization studies to specifically quantify proteins in mixtures.
New, biological product classes broaden the therapeutic spectrum and demand fast adaptation of process development workflows to produce the target molecule in high quality for the patient. One strategy to address this issue is phase behavior based process development as these alternative DSP steps can keep up the productivity while maintaining costs at a low level. Since processes based on phase behavior, e.g. protein crystallization or precipitation, rely on screening studies, screening methods and analytics transferable and applicable to new modalities need to be developed. When multi-variate sensors are used to record screening data, large inter-correlated data sets are generated that can be structured in each measurement dimension, e.g. time, wavelength, and sample number. The higher dimensionality of the data imposes new analytical challenges and can be utilized when suitable chemometric methods are applied. The multi-way, chemometric parallel factor analysis (PARAFAC) method can handle such multi-dimensional data sets and highly overlapping spectra, while revealing the contribution of individual species with regard to each dimension to the overall spectra. Without the need of an extensive calibration procedure, the models can provide process knowledge about the solution composition or pure component spectra when quantitative concentration analytics or purified components are missing. The application of PARAFAC models as a calibration-free analytical tool for phase behavior-based screenings is described in Chapter 4 and demonstrated with crystallization or precipitation screenings of various biological products in chemically defined or complex process fluids. Three screenings were conducted analyzing the liquid phase during crystallization or precipitation, the wash step, and the redissolution step. In fact, the first case study used the screening data of the study described in Chapter 3 to show that PARAFAC models can be used to characterize the solution composition of protein mixtures. The generated model could estimate the concentration and the spectra of two components – of the target molecule lysozyme and the contaminants as a mixture. Only species demonstrating different phase behavior and contributing to the protein spectrum were distinguishable, treating protein clusters expressing similar phase behavior as one species. Quantitative CEX analytics and pure component spectra of the target molecule could validate the estimated model outcomes. The second and third case studies served as real-case scenarios dealing with complex process fluids in a capture step. In the second case study, mAbs were precipitated in harvest cell culture fluid (HCCF), and the screening supernatants were analyzed with UV/Vis spectroscopy during different process steps. The PARAFAC model for the mAb case study could estimate the concentration changes as well as the pure component spectra of the target molecule mAb and other contaminants in the analyzed samples. The model was validated with analytical protein A chromatography and with the pure component spectra of the target. The third case study covered a precipitation screening of VLPs in Escherichia coli (E.coli) lysate. The VLP case study was conducted similarly to the mAb case study, but quantitative reference analytics were not available. The learnings from the first and second case study could be used to generate a third model that estimated the VLP concentration transferring the preprocessing and model parameters of the first two case studies. For qualitative validation, sodium dodecyl sulfate–polyacrylamide gel electrophoresis (SDS-PAGE) proved the presence or absence of the different protein species in the supernatants. Additionally, the model-estimated pure component spectrum of VLPs was compared with a spectrum of purified VLP s. Demonstrating the flexible application to different biological modalities, a multi-way chemometric model called PARAFAC was used to analyze multi-dimensional UV/Vis spectra in screening studies and to estimate the protein concentrations and pure component spectra. The data-driven workflow for calibration-free screening model development contributes to the overall goal of making protein crystallization or precipitation studies more feasible and easier to apply to capture processes, especially when multiple contaminants are present in the analyzed fluids.
On a larger scale than HT screenings, PAT sensors can also be implemented to monitor production processes in real-time. Regarding DSP with chromatography, PAT has been widely employed for measuring CQAs even in complex liquids. However, new challenges arise when PAT should be used to monitor crystallization processes in DSP. Solid crystals and the broad variety of impurities in liquid or potentially precipitated form may be present in the heterogeneous, complex process liquid and can influence the employed sensors. Furthermore, the crystallization process can induce great concentration changes in the supernatant. These challenges demand an adapted sensor set-up when PAT shall be implemented in protein crystallization processes. Chapter 5 describes the development of an adapted PAT set-up to monitor protein crystallization processes in complex process fluids. The set-up consisted of a Raman probe placed in situ in a lab-scaled crystallization vessel, UV/Vis on-line measurements with a variable pathlength (VP) flow cell, installed in a cross-flow filtration (CFF) based bypass to monitor the particle-free supernatant, and additional samples for off-line analysis. The off-line samples were analyzed with immobilized metal ion affinity chromatography (IMAC), enzyme-linked immunosorbent assay (ELISA), SDS-PAGE , and microscopic imaging to evaluate the target molecule concentration, HCP content, protein purity, and the crystals, respectively. The image analysis provided information about the crystal count and crystal geometry. Using this analytical set-up, the crystallization of Lactobacillus kefir alcohol dehydrogenase (LkADH) in clarified E.coli lysate was monitored and characterized. In total, five experiments were conducted on a 300 mL scale varying the lysis protocol, precipitant concentration, and whether or not the particle-free bypass was implemented. The Raman probe enabled in-line measurements of the liquid phase in the vessel despite the presence of solids in the crystalline slurry. The development of a PLS model, based on the preprocessed Raman spectra and off-line LkADH concentration measurements, enabled monitoring the concentration of the target molecule in the heterogeneous lysate supernatant in real-time. The predicted concentration decline in the supernatant indicated that protein crystals were formed and this concentration decline coincided with the detection of the first crystals in the microscopic images of the off-line samples. Concentration mismatches between the model and the reference data were visible at higher target concentration levels when the model was directly transferred to new experiments. Possible reasons may involve batch-to-batch variations and the heterogeneous lysate composition. The particle-free bypass facilitated the implementation of particle-sensitive analytics, here UV/Vis spectroscopy. As a qualitative purity indication, the UV/Vis absorption data could be used to determine the nucleic acid to protein ratio. Thanks to the implemented VP flow cell technology, the sensor could adapt quickly to changes in the UV/Vis absorption values. In the presented study, the CFF-based loop did not lead to crystal breakage as shown by the image analysis. Furthermore, the crystallization and redissolution of selected samples reached a 2-log$_{10}$ reduction in HCP content in one experiment. As a whole, the objective of this study was the development of a comprehensive PAT set-up adapted to the challenges of protein crystallization processes as a capture step. Regardless of the presence of impurities in soluble or precipitated form, the combination of Raman spectroscopy and chemometrics monitored the specific target concentration in the complex process fluids in a multi-phase systems.
Based on multi-variate spectra and chemometrics, this thesis provides promising data-driven analytics tailored to protein crystallization process development for DSP. Even though various biologics were investigated in process solutions with a varying degree of complexity, the presented PAT tools could quantify the target molecule in each study and be used across different scales. These findings let us rethink conventional process design and move towards a more flexible implementation of protein phase behavior-based processes in DSP.