Eine technische Reise: Wie man ein lokales, datenschutzfreundliches Tool für die Transkription und Zusammenfassung von Meetings entwickelt

FeldM_Blog_Illustration_DataFlowDashboard
Inhalte
  • Erstellen Sie Ihr eigenes Tool zur Transkription und Zusammenfassung von Meetings
  • Zusammenfassung
  • Schlussfolgerung
  • Haben Sie Fragen?

Übernehmen Sie die Kontrolle: Erstellen Sie Ihr eigenes datenschutzorientiertes Tool zur Transkription und Zusammenfassung von Meetings mit Open-Source-LLMs

Dieses Whitepaper beschreibt den Aufbau eines lokalen, datenschutzfreundlichen Tools zur Transkription und Zusammenfassung von Meetings unter Verwendung von Open-Source-LLMs (Large Language Models). Das Hauptziel besteht darin, eine Lösung zu schaffen, die einen verbesserten Schutz der Privatsphäre, eine bessere Anpassung und ein größeres Vertrauen der User bietet, indem alle Daten lokal aufbewahrt werden und somit die mit Drittanbieterdiensten verbundenen Risiken vermieden werden.

Kostenloses Whitepaper herunterladen (EN)

 

Zusammenfassung

  • Die herkömmliche Aufzeichnung von Besprechungen ist manuell, zeitaufwändig und oft subjektiv. Automatisierte Lösungen wie Copilot von Microsoft können diese Aufgaben übernehmen, werfen aber Bedenken hinsichtlich des Datenschutzes auf.

  • Eine lokale Lösung geht diese Probleme an, indem sie sicherstellt, dass alle Daten vom Benutzer kontrolliert und nicht extern gespeichert oder analysiert werden.

  • Das Tool ist so konzipiert, dass es effizient auf Consumer-Hardware läuft und die lokale Verarbeitung der Transkripte und Zusammenfassungen effektiv unterstützt, so dass es auch für Benutzer zugänglich ist, die keinen Zugang zu High-End-Hardware der Enterprise-Klasse haben.

  • Das Whisper.cpp Modell von OpenAI wird für die mehrsprachige Konvertierung von Sprache in Text über das Faster Whisper Framework verwendet. Dieses Modell wird aufgrund seiner Genauigkeit, insbesondere in Englisch und Deutsch, und seiner Fähigkeit, auf begrenzter Hardware effizient zu arbeiten, ausgewählt.

  • Self-Hosting eines LLM: Das Tool verwendet das Mixtral 8x7B-Modell für lokale Sprachverarbeitungsaufgaben. Um dieses Modell zu hosten, wurden verschiedene Frameworks für das Hosten von LLMs in Betracht gezogen, darunter HuggingFace’s Text Generation Inference, Llama.cpp und ExLlamaV2. Jedes hat Stärken und Einschränkungen, wie z.B. einfaches Setup, Hardwareanforderungen und Unterstützung für Modellformate.

  • Der Zusammenfassungsprozess verwendet einen Map-Reduce-Ansatz, um das begrenzte Kontextfenster von LLMs zu verwalten. Transkripte werden für die anfängliche Zusammenfassung in kleinere Abschnitte unterteilt, und diese Zusammenfassungen werden dann kombiniert, um eine endgültige umfassende Zusammenfassung zu erstellen

Schlussfolgerung

Trotz der Vorteile handelsüblicher Modelle wie GPT-4 werden in diesem Whitepaper die Vorteile des Selbsthostings hervorgehoben, darunter der Datenschutz und die Möglichkeit, Lösungen individuell anzupassen. Das Tool wurde in interne Arbeitsabläufe integriert, wodurch sich die Zeit für die Erstellung von Notizen erheblich verkürzt und die Qualität der Sitzungszusammenfassungen verbessert hat, auch wenn die menschliche Kontrolle zur Gewährleistung der Genauigkeit weiterhin unerlässlich ist.

Insgesamt hebt das Whitepaper die praktischen Schritte und Überlegungen hervor, die bei der Entwicklung eines lokal gehosteten Tools zur Transkription und Zusammenfassung von Meetings unter Wahrung des Datenschutzes und unter Verwendung von Open-Source-KI-Technologien erforderlich sind.

Haben Sie Fragen zu diesem Thema, zu LLMs im Allgemeinen oder sind Sie neugierig, wie Sie KI in Zukunft in Ihrem Unternehmen einsetzen können? Wenden Sie sich an unseren Kollegen – unser Team steht Ihnen gerne mit Rat und Tat zur Seite! Oder lesen Sie hier mehr.

 

Haben Sie Erfahrungen mit Tools zur Transkription oder Zusammenfassung von Meetings – entweder im privaten oder beruflichen Kontext? Wir sind gespannt auf Ihre Meinung und freuen uns auf einen Austausch dazu.

 

Kontaktieren Sie uns