Swiss ICT Award gewonnen

19. November 2010 05:03; Akt: 18.11.2010 15:31 Print

«Das ist eher ein Zufallstreffer»

von Henning Steier - Technologie von Linguistic Search Solutions soll Geldwäscher und Terroristen aufspüren: CEO Bertrand Lisbach verrät im Interview, ob er Angst vor Google hat und warum er aufs Marketing verzichtet.

storybild

Traphoty: So sieht beispielsweise eine Benutzeroberfläche aus.

Zum Thema
Fehler gesehen?

«Für einen Namen wie Suleyman Hussein gibt es viele Schreibweisen», sagt Bertrand Lisbach. Der Chef von Linguistic Search Solutions sitzt vor seinem Notebook und klickt in einer simplen Eingabemaske auf den Such-Button. Nahezu in Echtzeit werden auf der Ergebnisseite etwa 20 Treffer angezeigt. Darunter sind auch solche, die sich in vielen Buchstaben von der ursprünglichen Eingabe unterscheiden, beispielsweise Souleymane Houssayn. «Wenn Namen vom arabischen Alphabet in unser lateinisches transkribiert werden, können sehr unterschiedliche Varianten herauskommen. Ausserdem gibt es im Arabischen nicht die klassische Aufteilung in Vor- und Nachnamen, sondern eine Namenskette, die aus fünf verschiedenen Namenstypen bestehen kann», erläutert Lisbach. Sein Unternehmen Linguistic Search Solutions hat eine Suchtechnologie entwickelt, die Personen finden soll, deren Namen in verschiedenen Sprachen unterschiedlich geschrieben und strukturiert werden. Ein anderes Paradebeispiel des 43-Jährigen ist Jelzin. Der Nachname des ehemaligen russischen Präsidenten wird auf Englisch Yeltsin und auf Französisch Eltsine geschrieben. Hätte Jelzin zu Lebzeiten bei der Londoner Filiale einer Grossbank ein Konto eröffnen wollen, hätte man dort mit der Suchtechnologie von Linguistic Search Solutions sehen können, auf welchen Prüflisten er steht oder ob er in der Zürcher Zentrale bereits ein Konto hat. Und dies unabhängig davon, in welcher Variante Jelzins Namen in den verschiedenen Quellen vorkommt.

Angezeigt werden in der präsentierten Demo-Version der Name, Geburtsdatum, Nationalität, Wohnort und der so genannte Matchscore. Letztgenannter gibt an, mit welcher Wahrscheinlichkeit es die gesuchte Person ist. Laut Lisbach kann man beliebig viele Suchkriterien definieren. Zusatzinformationen lassen sich durch Anklicken des Namens aufrufen. Der zugrundeliegende Algorithmus gewichtet bestimmte Kriterien stärker als andere: Stimmt die Adresse nicht überein, spielt dies beispielsweise nur eine untergeordnete Rolle, weil jemand eher umzieht als seinen Namen ändert.

Linguistic Search Solutions hat seinen Sitz in Baar. Das Start-up wurde im April 2008 gegründet. Mittlerweile arbeiten etwa zehn Festangestellte und 20 Freelancer für die selbstfinanzierte Firma. Lisbach und die anderen Mitbesitzer üben teilweisen Lohnverzicht. In diesem Jahr will man aber profitabel werden und allen auskömmliche Gehälter zahlen.

20 Minuten Online: Wie sind Sie auf diese Geschäftsidee gekommen?
Bertrand Lisbach: Zum einen habe ich Psychologie und Informationswissenschaften studiert und mich dabei intensiv mit computergestützter Datenanalyse beschäftigt. Zum anderen habe ich eine Zeit lang im Mittleren Osten gelebt und Arabisch und Hebräisch gelernt. Dort ist mir erstmals bewusst geworden, dass die hebräischen und arabischen Namen in Zeitungen verschiedener Sprachen unterschiedlich geschrieben werden. Während meiner Zeit als Berater von Finanzdienstleistern hatte ich später die Aufgabe, die Qualität von Suchprozessen zu verbessern und Suchlösungen zu testen. Die meisten waren kaum in der Lage, übliche Variationen in der Schreibung von Namen zu finden. Gleichzeitig produzieren sie aber zahlreiche irrelevante Treffer. Wegen dieser irrelevanten Treffer stellen viele Banken ihre Suche sehr exakt ein. Dann erhält man zwar nur wenige Treffer, aber es entgehen einem vielleicht entscheidende Informationen.

Ich nehme an, die Namen der Lösungen, die Sie getestet haben, nennen Sie jetzt nicht.
Da liegen Sie richtig.

Über die Preise Ihrer Lösung sprechen Sie aber, oder?
Eine Desktop-Lizenz kostet 15 000 Franken. Eine solche Lizenz ist zum Beispiel für Vermögensverwalter gedacht, die ein paar Mal vereinzelt Kunden mit Prüflisten abgleichen wollen. Eine Firmen-Lizenz für beliebig viele Nutzer kostet ab 150 000 Franken, doch kommt noch eine Query-Fee hinzu. Diese Fee beträgt je nach Query-Paket ein paar Rappen pro Suchabfrage. Sehr grosse Kunden bestellen sich eine Flatrate. Der Listenpreis für beliebig viele Abfragen von einer unbegrenzten Zahl an Arbeitsplätzen über alle Geschäftsprozesse hinweg beträgt bis zu 1,5 Millionen Franken pro Jahr.

Ein wichtiges Anwendungsgebiet Ihrer Software Traphoty ist die Durchsuchung von Listen so genannter politisch exponierter Personen (PEPs) – Politiker, Militärs und religiöse Würdenträger. Diese Daten werden von Unternehmen wie World-Check und Dow Jones aufbereitet. Warum haben diese keine eigene Lösung entwickelt?
Ich kann natürlich nicht für diese Firmen sprechen. Aber vielleicht positionieren sich World-Check und Dow Jones Risk & Compliance weniger als Technologie-Anbieter, sondern eher als Anbieter von Compliance-Daten. Dort liegt ihre Kernkompetenz. Sie konsolidieren Hunderte von nationalen und internationalen Prüflisten und erfassen Hunderttausende Profile politisch exponierter Personen, sowie deren Verwandte und Geschäftspartner. Banken nutzen diese Daten, um Geldwäscherei und Korruption zu bekämpfen oder um Sanktionen einzuhalten. Und hier kommt die Suchtechnologie ins Spiel. Die Daten der Bankkunden müssen mit den Compliance-Daten zuverlässig abgeglichen werden, auch bei variierender Schreibweise. Die Namen in den Kundendateien kommen meistens von einem Ausweisdokument; die Compliance-Daten sind in der Regel den Medien entnommen. So kann es leicht vorkommen, dass der Name derselben Person unterschiedlich geschrieben ist. Vor 9/11 gab es nur wenige Compliance-Daten und relativ laxe Vorschriften. Seit einem Jahrzehnt verschärfen sich die Anforderungen der Aufsichtsbehörden massiv, was Datenanbieter wie World-Check und Dow Jones zugute kommt. Für uns ist es sehr günstig, dass beide unsere Kunden sind und unsere Arbeit unterstützen.

Und wozu brauchen die Firmen nun gerade Ihre Lösung?
Die meisten Suchtechnologien arbeiten mit simplen, rein mathematischen Algorithmen. Damit kann nicht zuverlässig erkannt werden, ob ein Kunde auf einer Sanktionsliste steht. Diese nicht-linguistischen Suchtechnologien sind auch unpräzise und schlagen oft Fehlalarm. Das erzeugt Kosten. Unser Ansatz unterscheidet sich von dem herkömmlichen Vorgehen darin, dass wir den Ursachen von Namensvariationen auf den Grund gegangen sind. Und diese Ursachen sind nicht mathematischer, sondern linguistischer Natur. Daher arbeiten wir in erster Linie mit linguistischen Algorithmen. Statt eines einfachen mathematischen Algorithmus enthält unsere Software Tausende linguistischer Regeln. Dies wirkt sich natürlich auf die Qualität der Suchresultate aus. Und das spart Kosten in den Compliance-Abteilungen und reduziert das Risiko der Bank.

Wie kann man sich eine solche Regel konkret vorstellen?
Eine einfache Regel könnte z.B. lauten: Endet ein russischer Name auf –ev, wie in Gorbachev, könnten die letzten Buchstaben auch ov oder ow sein, wie in Gorbatschow. Oder ein Beispiel für eine phonetische Regel: Im Deutschen ist ein T vor einem Z stumm. Daher hört man den Unterschied zwischen Schwartz mit T und Schwarz ohne T nicht. Im Englischen sind die phonetischen Regeln andere. Hier hören sich zum Beispiel U und EW of gleich an, wie in Stuart und Stewart. Was sich gleich anhört, wird oft vertauscht. Die Regeln müssen so formuliert werden, dass jede legitime Variation eines Namens mit jeder anderen legitimen Variation desselben Namens matcht, aber nicht mit anderen Namen. In der Umsetzung ist das sogar noch etwas komplizierter als es sich anhört. Es gibt übrigens auch Variationen, die wir nicht mit Regeln, sondern mit Thesauri abdecken. Dazu gehören Standardabkürzungen, wie sie etwa bei Firmennamen üblich sind, beispielsweise AG für Aktiengesellschaft. Auch Spitznamen finden sich im Thesaurus. Bill und William sind im Amerikanische austauschbar, Sasha und Alexander im Russischen und Paco und Francisco im Spanischen. Und für welche Grundformen kann der Nickname Nell stehen? Das sind typische Fragen, mit denen sich unsere Sprachexperten beschäftigen.

Wie sieht ein typischer Business Case Ihres Unternehmens aus?
Eine Bank kauft unsere Software. Kundenberater und Compliance-Officer verwenden sie für Einzelabfragen. Screening-Systeme verwenden sie für den automatischen Abgleich von Transaktions- und Kundendaten mit Prüflisten, wie sie World-Check, Dow Jones oder Accuity liefert. Die IT verwendet sie zur Dublettenerkennung und Datenkonsolidierung.

Theoretisch könnten Sie eine Website ins Netz stellen, welche Sanktionsdaten nutzt. Das wäre zumindest für kleinere Unternehmen interessant.

Mag sein, wir wollen aber nicht zur Konkurrenz von Datenanbietern werden. Unser Ziel ist es, dass die Anbieter von Compliance-Daten unsere Suchtechnologie auf ihren eigenen Websites einsetzen und ihren Kunden damit verbesserte Online-Abfragen ermöglichen.

Kunden können Ihre Suchtechnologie nur mit eigenen oder gekauften Datenbanken benutzen. Warum kann man sie nicht aufs ganze Internet anwenden?
Wir haben einige Module, die auch auf das Internet angewendet werden können. Aber Sie haben recht: Bei unserer grossen Suchlösung Traphoty geht das nicht. Das hat damit zu tun, dass wir eine auf Personendaten optimierte Indexierung entwickelt haben. Diese kann man nicht ohne weiteres auf den unstrukturierten Datenbestand des Internets anwenden. Eine Erweiterung unserer Personensuche auf News-Artikel werden wir voraussichtlich in der Zukunft angehen.

Was ist mit Google Translate? Ihr erwähntes Beispiel, Eltsine, übersetzt das Angebot des Suchmaschinisten bereits korrekt ins deutsche Jelzin.
Ich glaube, das ist eher ein Zufallstreffer. Bei anderen Namen werden Sie nicht fündig, unter anderem bei den Varianten Putin und Poutine Das soll aber keine Kritik an Googles Übersetzungsdienst sein, denn er ist ja gar nicht dafür gedacht, Variationen von Eigennamen zu finden. Übersetzungen sind bei Namen zumeist irrelevant. Der deutsche Herr Schwarz wird nicht zu Mr. Black, wenn er in der englischen Presse steht. Aber der Vergleich ist interessant. In der computergenerierten Übersetzung von Texten werden Linguistik und IT schon seit Jahrzehnten in Verbindung gebracht, so wie wir es nun auf dem Spezialgebiet der Namen tun. Google bietet überdies mit der übersetzten Suche die Möglichkeit, Anfragen in einer Sprache einzugeben und sucht dann in einer anderen. So kann man auch Treffer von Websites nutzen, die einem sonst wohl verborgen blieben. Das Problem der sprachabhängigen Variation von Eigennamen, auf das wir uns fokussieren, ist in der Websuche nach meiner Einschätzung aber noch nicht zuverlässig gelöst. Ich könnte mir gut vorstellen, hier mit Google und anderen Suchmaschinen zu kooperieren.

Von Suchmaschinen und Finanzdienstleistern abgesehen, für wen könnte Ihre Lösung sonst noch interessant sein?
Zu unseren potenziellen Kunden zählen Medienhäuser, Bibliotheken, Auskunfteien, Telefonverzeichnisse, Aufsichtsbehörden, Sozialbehörden und der Polizei. Bei der Polizei fliessen Daten aus verschiedenen Ländern zusammen und dabei kommen landesspezifische Schreibvarianten vor. Unsere Software kann helfen, die Daten zu konsolidieren und suchbar zu machen.

In Ihrem Geschäftsfeld tummeln sich unter anderem grosse Anbieter wie Informatica, Basis Technology und IBM. Wie wollen Sie bestehen?
Erstens ist der globale Markt riesig und noch wenig durchdrungen mit linguistischer Suchtechnologie. Übrigens auch nicht in der Schweiz. Es hat also Platz für mehrere Anbieter. Zweitens hoffen wir, mit der Qualität unserer Produkte zu überzeugen. Und drittens versuchen wir attraktive Partner von Software-Firmen zu sein, die bereits Namen und Marktzugang haben. Dementsprechend haben wir unsere Produkte so gebaut, dass sie sich leicht in beliebige andere Applikationen einbauen lassen. Unsere Installationen in China und dem Mittleren Osten haben wir unseren Partnern zu verdanken. Ein erwünschter Nebeneffekt dieses auf Kooperation ausgerichteten Geschäftsmodells ist der, dass wir auf eine eigene Marketingabteilung erstmal verzichten können. Wir haben keine grossen Aufwände in der Kundenakquise und können uns ganz auf das konzentrieren können, worin wir wirklich gut sind.