Die Bioinformatik verknüpft Inhalte aus den Lebenswissenschaften mit mathematischen Konzepten aus der Informatik und ist wesentlich an den aktuellen Fortschritten in der Molekularbiologie und Medizin beteiligt. Sie ist nicht, wie fälschlicherweise in einigen Publikationen behauptet wird, ein Teilgebiet der Systembiologie, sondern vielmehr ist die Systembiologie ein - wenngleich bedeutsamer -Anwendungsbereich der Bioinformatik. Weitere Anwendungsbereiche sind die Strukturbiologie, die pharmazeutische und biotechnologische Forschung, die Genom-, Proteom-, Transkriptom- und Metabolomanalyse.
Ein Kernbereich der Bioinformatik umfasst die Entwicklung von Software zur Speicherung, Auswertung und Analyse von wissenschaftlichen Messdaten. Die Hauptaufgabe der Bioinformatik liegt jedoch in der Entwicklung von verlässlichen Algorithmen zur Vorhersage biologischer Funktionen aus großen Datenmengen, sowie der Entwicklung von Algorithmen zur Simulation biologischer Prozesse basierend auf diesen Daten.
Die Bioinformatik ist deshalb eine eigenständige Wissenschaft, da nur mit Hilfe ausgefeilter bioinformatischer Algorithmen verwertbares Wissen aus großen Datenmengen generiert und für die Vorhersage biologischer Funktionen nutzbar gemacht werden kann. Das langfristige Ziel dieser Disziplin ist die computergestützte Simulation aller bekannten Lebensvorgänge einer menschlichen, tierischen oder pflanzlichen Zelle. Daraus ergibt sich als mittelfristige Zielsetzung die Erfassung, Speicherung und Analyse von Informationen über die essentiellen biochemischen Prozesse der Zellen. Datenbankentwicklungen nehmen in diesem Zusammenhang einen großen Stellenwert innerhalb der Bioinformatik ein. Ferner ist mittelfristig das Ziel, die Interaktionen der einzelnen Zellen untereinander, als auch mit ihrer Umgebung zu erfassen. Des Weiteren sind insbesondere Moleküle und biochemische Reaktionen von Interesse, deren Funktion durch Gen- oder Proteinmodifikationen verändert wird. So werden bioinformatische Algorithmen verwendet, um die Funktion von einzelnen Genen und Proteinen zu bestimmen und die regulatorischen Bestandteile der Zellen zu ermitteln.
Das Verständnis der Bioinformatik setzt allerdings grundlegende Kenntnisse der Biologie, Chemie und insbesondere der Biochemie voraus. Aus diesem Grunde werden die benötigten Grundlagen aus den genannten Disziplinen in diesem Buch vorab eingeführt. Weiterhin werden wichtige molekularbiologische Methoden und Arbeitstechniken vorgestellt und die Grundlagen der Stochastik und Statistik behandelt.
Das Kurzlehrbuch Bioinformatik wendet sich ebenso an Bachelor- und Master Studenten, wie auch an fortgeschrittene Wissenschaftler der Lebenswissenschaften und der Informatik, die sich grundlegende Kenntnisse in der Bioinformatik aneignen möchten. Es dient sowohl zum Einstieg in die Disziplin, als auch zur Vertiefung bereits vorhandener Kenntnisse.
In the past, Bioinformatics has been mostly classified as a bridge discipline between Informatics and Biology rather than an independent (stand-alone) scientific discipline. But with the comprehensive accumulation of biological data and the resulting challenges Bioinformaticians concentrate more on their own research rather than simply serving as technologists for others. Nowadays, the focus in Bioinformatics is mainly on the development of sophisticated algorithms capable of extracting useful knowledge from large data sets by combining methods from statistics and artificial intelligence.Computational Proteomics and Metabolomics are the most emerging fields of bioinformatics. Metabolomics is the study of the small molecules (metabolites) in biological samples such as cells or tissues. This includes their identification and quantification as well as the interaction between them.
Proteomics is the study of the entire set of proteins of a given cell type, cell compartment or specific tissue under defined conditions at a specific time. Combined with high-resolution mass spectrometry (MS) the technology allows the identification and quantification of thousands of proteins. Protein separation by 2D- gel electrophoresis (2D-PAGE), followed by mass spectrometry (MS) or tandem mass spectrometry (MS/MS) identification is the classical method for protein identification by mass spectrometry. In the currently predominated shotgun proteomics strategy, a proteolytic digest of the protein sample is analysed by LC-MS/MS. In such a pipeline, one MS1 (full scan) spectrum is obtained roughly every second and a set of the most abundant ions from the MS1 scan are selected for fragmentation and recording of MS2 spectra (MS/MS).
The identification of peptides from acquired MS/MS spectra is either performed using a database search approach or a spectrum-spectrum search. In the first case the experimental m/z values are compared to calculated m/z values derived from peptides produced by an in silico digestion of a protein sequence library. This approach implies a robust and reliable functional protein sequence annotation. In the latter case the identification of peptides is carried out by matching spectra of unknown shotgun analyses against the reference spectra of the library. An advantages of that approach is a more simple visual discrimination of false positive identifications as well as a search time reduction due to smaller number of peptide sequence information.
Bioinformatics links content from the life sciences with mathematical concepts from computer science and is significantly involved in the current advances in the molecular biology and medicine. Bioinformatics is not as misleadingly claimed in some publications a sub-field of systems biology, rather the systems biology is an important application field of bioinformatics. Further areas of application are the structural biology, the pharmaceutical and biotechnological research, the Genome-, Proteome-, Transcriptome- and Metabolom Analysis.
A core field of Bioinformatics comprises the development of software for the storage, evaluation and analysis of scientific data. However, the main task of bioinformatics is in the development of reliable algorithms for predicting biological functions of large biological datasets, as well as the development of algorithms for the simulation of biological processes based on these data.
Bioinformatics is an independent science, because only with the help of sophisticated bioinformatics algorithms it will be possible to generate usable knowledge for the prediction of biological functions based on such large amounts of data.
The long-term goal of this discipline is the computer-aided simulation of all known life processes of a human, animal or plant cell. As a result, the medium-term objective for bioinformaticians will be gathering, storage and analysis of information about crucial biochemical processes of living cells. In this context, the development of biological databases plays an important role. Another medium-term goal will be analysis of the interactions of individual cells with each other, as well as with their environment. Moreover, there are in particular molecules and biochemical reactions of note, whose function is altered based on gene- or protein modifications. In this context, bioinformatic algorithms will be used to determine the function of individual genes and proteins as well as to identify the regulatory components of the cells. A prerequisite for the understanding of the content as presented in the book requires a basic knowledge of biology, chemistry and biochemistry in particular.
For this reason, at the beginning of this book the required basics in biology, chemistry and biochemistry as well as important methods in molecular biology, essential working techniques and the basics of probability and statistics will be introduced.
Das Kurzlehrbuch Bioinformatik wendet sich ebenso an Bachelor- und Master Studenten, wie auch an fortgeschrittene Wissenschaftler der Lebenswissenschaften und der Informatik, die sich grundlegende Kenntnisse in der Bioinformatik aneignen möchten. Es dient sowohl zum Einstieg in die Disziplin, als auch zur Vertiefung bereits vorhandener Kenntnisse.