Wir freuen uns wahnsinnig darüber den Folgeauftrag für die Erweiterung unserer Machine-Learning-basierten Lösung zur Informationsextraktion aus eingescannten persönlichen Dokumenten. Nachdem wir im Rahmen der Vorqualifikation extrem starke Mitbewerber ausgeschaltet haben, können wir nun unsere gesamte Aufmerksamkeit dem Tuning der Extraktionsgenauigkeiten in Richtung der 100%-Marke widmen.
Jobs & News
Informationsextraktion aus OCR: The next level
Multilinguale Textgenerierung (NLG) für ein Google-gefördertes Start-Up
Die Ereignisse der letzten Jahre haben den hohen Bedarf an exakten und wahrheitsgemäßen Wahlprognosen unterstrichen. LangTec freut sich daher riesig, in diesem Bereich einen Beitrag leisten zu können. Gemeinsam mit einem Münchner Start-Up, das im Rahmen der Google News Initiative gefördert wird, werden wir mit unserer leistungsstarken Textgenerierungslösung TextWriter vollautomatisiert aktuelle Berichte über Vorwahlumfragen in zahlreichen Ländern und Sprachen erstellen. Unsere NLG-Technologie TextWriter generiert nicht nur natürliche Texte, sondern ermittelt auch im Handumdrehen tiefgehende analytische Erkenntnisse.
Schön, dass du mit dabei bist, Dr. Christian Betz!
Wir sind super happy, dass Dr. Christian Betz als Senior-Berater Teil unseres Teams wird. Chris hat im Bereich Künstliche Intelligenz promoviert und bringt viele Jahre Erfahrung in den Bereichen Software Engineering, Software-Architektur und Maschinellem Lernen (ML) mit. Das wird richtig cool!
Riesige Mengen Trainingsdaten für maschinelles Lernen? Entdecken Sie DataGenerator!
Endlich sind die Zeiten vorbei, in denen maschinelles Lernen (ML) durch die begrenzte Verfügbarkeit von Trainingsdaten eingeschränkt wurde. Stand heute gibt es eine Vielzahl an Anwendungsfällen, für die ML-Algorithmen komplexe Muster aus riesigen Mengen an Trainingsdaten erlernen. Meistens sind gute Trainingsdaten jedoch nur schwer in ausreichender Menge zu beschaffen, vor allem wenn es um persönliche oder vertrauliche Dokumente geht, beispielsweise Personalausweise, Versicherungsverträge oder Sozialversicherungsausweise.
Daher hat LangTec mit DataGenerator eine eigene KI-Lösung geschaffen, um große Mengen stark diversifizierten Trainingsdaten synthetisch zu generieren. Zur Initialisierung von DataGenerator wird nur eine sehr kleine Zahl repräsentativer Beispieldokumente benötigt. DataGenerator erzeugt dann Hunderttausende einzigartiger Dokumentinstanzen, von denen selbst die datenhungrigsten Lernalgorithmen satt werden.
Automatisierte Börsenberichte für den englischen Markt
TextWriter, LangTecs KI-Lösung zur automatisierten Textgenerierung (NLG), berichtet nun auch für den englischen Markt über internationale Börsenplätze. Leseproben gibt es hier: www.bankernews.co.uk.
Spannendes neues Entwicklungsprojekt für einen globalen Technologieriesen
Beginnend im Juli 2018 werden einige unserer seniorigsten Entwickler einen globalen Technologieriesen aus München bei der Umsetzung einer automatisierten Analyse von Meeting-Inhalten mithilfe von automatisierter Spracherkennung (ASR) unterstützen. Ziel des Projekts ist die Umsetzung eines komplett automatisierten Workflows zur Verarbeitung von Audio-Mitschnitten in einem Prozess der voll automatiserten semantischen Anreicherung.
Machine Learning auf komplexen Produktdaten für global agierenden E-Commerce-Riesen
Im Zuge unserer langjährigen Zusammenarbeit mit einem der führenden e-Commerce-Anbieter weltweit freuen wir uns sehr, das dort neu gegründete Team für maschinelles Lernen im Bereich komplexer Produktdaten weiter zu unterstützen. Unser Beitrag basiert auf unserem besonderen Kompetenz-Mix aus maschinellem Lernen (ML) und Textanalytik (NLP).
LangTec schlägt KI-Riesen mit links
Wow … David gegen Goliath mit LangTec in der Rolle des David.
Einer unserer Kunden aus dem Finanzsektor ließ LangTecs kundenspezifische Lösung zur Informationsextraktion gegen eine international beworbene, kommerzielle Semantik-Engine der Luxusklasse, entwickelt von einer globalen Technologiesupermacht, antreten. Jetzt kommt’s: Unsere Machine-Learning-Lösung erreichte dabei doppelt so hohe Extraktionsgenauigkeiten wie Goliaths elektronisches Superhirn!
Und ja, nur falls Ihr es Euch nicht schon gedacht habt: wir sind verdammt stolz darauf 🙂
Maschinelles Lernen auf OCR-Daten für eine internationale Großbank
Keine Ahnung was im Moment auf dem Markt los ist, aber scheinbar entdecken gerade alle die gute alte Texterkennung (Optical Character Recognition, OCR) als interessantes Betätigungsfeld wieder. OCR beinhaltet die Erkennung textueller Elemente in Bildmaterial, wie zum Beispiel eingescannten Dokumenten oder Screenshots. Wir haben jetzt den Auftrag für unser drittes Projekt in diesem Bereich erhalten. Dabei geht es speziell um die Verwendung von komplexen maschinellen Lernverfahren (ML) und Textanalytik (NLP) um geschäftskritische Informationen mit möglichst hoher Genauigkeit aus eingescannten Dokumenten zu extrahieren.
Ahoi, Julian Mechow!
Wir freuen uns, ab heute Julian Mechow als Werksstudenten im Bereich Software-Entwicklung bei uns an Bord begrüßen zu können.
@ Julian: Dir einen guten Start in unserem großartigen Team und viel Spaß bei der Weiterentwicklung unserer Textgenerierungs-Engine TextWriter!
Read More