Fortschritte in den Biowissenschaften führen zu sehr großen Datenmengen unter anderem über das
menschliche Genom Krankheitserreger oder die Wirkungsweise von Proteinen. Häufig liegen diese
Erkenntnisse in getrennten Datenbanken vor hängen jedoch inhaltlich zusammen. Jan Hegewald
liefert einen Beitrag zur Integration von Informationen aus verschiedenen Datenquellen. Er
stellt einen Algorithmus vor um gleiche Objekte in verschiedenen Datenbanken zu finden. Dieses
Verfahren erlaubt viele große Datenbanken schnell zu analysieren und im Folgenden beinahe
automatisiert Informationen zu integrieren. Verteilte Daten werden dadurch handhabbar und
vernetztes Wissen ermöglicht neue Erkenntnisse. Das Verfahren wurde anhand von biologischen
Datenbanken entwickelt. Es ist jedoch ebenso auf Daten anderer Bereiche anwendbar.