| |
| In diesem Forum haben Sie die Möglichkeit Kommentare, Fragen und Verbesserungsvorschläge zu den im vb@rchiv gelisteten Tipps und Workshops zu posten.
Hinweis: Ein neues Thema kann immer nur über die jeweilige Tipps & Tricks bzw. Workshop Seite eröffnet werden! | Fragen zu Tipps & Tricks und Workshops im vb@rchivTipp 2127: Anzahl Wörter eines Textabsatzes zählen | | | Autor: keco | Tipp anzeigenDatum: 26.01.10 15:42 |
| Da hast du dir sicherlich viel Arbeit gemacht, danke dafür!
Ich habe damals solch eine Funktion gesucht, leider kam ich auf kein zufriedenstellendes Ergebnis. Nachdem ich mich aber mit den regulären Ausdrücke befasst habe, habe ich eine Funktion schreiben können, die das gleiche macht. ''' <summary>
''' Zählt die Anzahl der Wörter im Text, wobei Wörter, die durch ein
' Unterstrich (_), ein Minus
''' (-) oder einem Slash (/) getrennt sind als ein Wort gezählt werden.
''' </summary>
''' <param name="text">Der zu prüfende Text.</param>
''' <returns>Die Anzahl der im Text enthaltenen Wörter.</returns>
''' <remarks></remarks>
Public Function WordsCount(ByVal text As String) As Integer
Dim regex As New System.Text.RegularExpressions.Regex( _
"[a-zA-Z_0-9äöüß\-/]+", RegularExpressions.RegexOptions.None)
Return regex.Matches(text).Count
End Function Ein Wort enthält hierbei alle Zeichen des Alphabets plus deutsche Umlaute, alle 10 Ziffern und darf _ (Unterstrich), - (Minus) und ein / (Slash) enthalten. Bei allen anderen Zeichen wird ein Wort als beendet betrachtet.
Zu beachten ist allerdings, dass diese Funktion ausschließlich für deutsche Texte eine genaue Zählung hervorbringt. Ein weiterer Unterschied ist, dass beispielsweise ein aus Microsoft Word eingefügter Text meist spezielle Sonderzeichen wie einen langen Bindestrich oder die ... in ein eigenes Sonderzeichen wandelt und dadurch in Dieter's Methode als ein eigenes Wort betrachtet werden (eventuell ungewollt?). Bei 20.000 Wörtern wird meine Methode mit RegEx um etwa 20ms schneller ausgeführt, eigentlich nicht wirklich schneller. | |
Re: Anzahl Wörter eines Textabsatzes zählen | | | Autor: Maas | Datum: 26.01.10 16:32 |
| Anmerkung zur Geschwindigkeit: Hier mal ein echt guter Artikel über die Optimierung von String-Operationen und wann es sich lohnt RegEx zu benutzen.
Maas | |
Re: Anzahl Wörter eines Textabsatzes zählen | | | Autor: keco | Datum: 26.01.10 17:41 |
| Ich habe mir den Artikel durchgelesen (zumindest bis zum Replace). In dem Falle könnte man separieren. Bei einem langen Suchbegriff und großem Text automatisch mit RegEx suchen lassen, ansonsten die integrierten Methoden bzw. eine eigene Methode verwenden.
Ich werde jedenfalls noch den Rest durchlesen und mir den Blog-Artikel von dem dortigen Link anschauen (bezüglich der Besonderheiten von RegExOptions.Compiled). Danke für den Link. | |
| Sie sind nicht angemeldet! Um einen neuen Beitrag schreiben zu können, müssen Sie sich zunächst anmelden.
Einloggen | Neu registrieren |
|
|
TOP! Unser Nr. 1
Neu! sevDataGrid 3.0
Mehrspaltige Listen, mit oder ohne DB-Anbindung. Autom. Sortierung, Editieren von Spalteninhalten oder das interaktive Hinzufügen von Datenzeilen sind ebenso möglich wie das Erstellen eines Web-Reports. Weitere InfosTipp des Monats Access-Tools Vol.1
Über 400 MByte Inhalt
Mehr als 250 Access-Beispiele, 25 Add-Ins und ActiveX-Komponenten, 16 VB-Projekt inkl. Source, mehr als 320 Tipps & Tricks für Access und VB
Nur 24,95 EURWeitere Infos
|
|
|
Copyright ©2000-2024 vb@rchiv Dieter Otter Alle Rechte vorbehalten.
Microsoft, Windows und Visual Basic sind entweder eingetragene Marken oder Marken der Microsoft Corporation in den USA und/oder anderen Ländern. Weitere auf dieser Homepage aufgeführten Produkt- und Firmennamen können geschützte Marken ihrer jeweiligen Inhaber sein.
Diese Seiten wurden optimiert für eine Bildschirmauflösung von mind. 1280x1024 Pixel
|
|