| |

VB.NET - Ein- und UmsteigerWortliste, Datenmenge reduzieren | |  | Autor: DotNetErbse | Datum: 12.07.14 11:56 |
| Hallo zusammen,
ich möchte in einer VBA-Anwendung eine Volltext-Such-Funktion zur Dokumentenauswahl integrieren.
Dazu habe ich mir von allen infrage kommenden (Word)-Dokumenten eine sortierte Wortliste erstellt.
Die werden dann später auf Vorhandensein von Begriffen durchsucht und bei Gefunden das Dokument in der Liste angezeigt. Da ist auch alles fertig.
Das passiert automatisch beim Schließen des Dokumentes in VBA.
Ich kann aber auch von einer .NET-Anwendung kommen und die Wortlisten erzeugen. Das wäre wahrscheinlich erheblich schneller, wegen der Möglichkeiten, die .NET bietet.
Ich denke da nur an .sort(), .contains() usw.
Nun möchte ich die Routine zum Erzeugen der Wortliste anpassen, weil die nur stur jedes Wort der Liste hinzufügt, wenn es noch nicht vorhanden ist, damit keine Doppelungen vorkommen.
Das reduziert die Liste ja schon mal. Ich will ja später nicht wissen, wie oft der Suchbegriff vorkommt, sondern nur ob
Aber bei
a
an
antenne
e
en
n
ne
t
ten
genügt m.E. ja "antenne", was nochmals eine erhebliche Reduzierung der Daten ergeben würde.
Wie soll ich denn da herangehen?
Beginnend bei den längsten Wörtern ermitteln, welche kürzeren Wörter "nicht" enthalten sind?
Da müsste ich mehrere Pässe machen, jeweils mit weiteren kürzeren Wörtern, die nicht in die vorherige Liste passen? Die Wörter, die passen kann ich ja verwerfen für die End-Liste...
Mit freundlichen Gr??en
DotNetErbse
[Es hei?t Paket und nicht Packet, auch wenn Standard augenscheinlich von Standar(t)e kommt,hei?t es dennoch Standar(d)] |  |
 | Sie sind nicht angemeldet! Um auf diesen Beitrag zu antworten oder neue Beiträge schreiben zu können, müssen Sie sich zunächst anmelden.
Einloggen | Neu registrieren |
  |
|
sevISDN 1.0 
Überwachung aller eingehender Anrufe!
Die DLL erkennt alle über die CAPI-Schnittstelle eingehenden Anrufe und teilt Ihnen sogar mit, aus welchem Ortsbereich der Anruf stammt. Weitere Highlights: Online-Rufident, Erkennung der Anrufbehandlung u.v.m. Weitere InfosTipp des Monats Neu! sevEingabe 3.0 
Einfach stark!
Ein einziges Eingabe-Control für alle benötigten Eingabetypen und -formate, inkl. Kalender-, Taschenrechner und Floskelfunktion, mehrspaltige ComboBox mit DB-Anbindung, ImageComboBox u.v.m. Weitere Infos
|
|
|
Copyright ©2000-2025 vb@rchiv Dieter Otter Alle Rechte vorbehalten.
Microsoft, Windows und Visual Basic sind entweder eingetragene Marken oder Marken der Microsoft Corporation in den USA und/oder anderen Ländern. Weitere auf dieser Homepage aufgeführten Produkt- und Firmennamen können geschützte Marken ihrer jeweiligen Inhaber sein.
Diese Seiten wurden optimiert für eine Bildschirmauflösung von mind. 1280x1024 Pixel
|
|