Rubrik: Dateisystem · Dateien lesen/schreiben | VB-Versionen: VB2005, VB2008 | 31.12.10 |
Anzahl der Zeilen einer Textdatei schnell ermitteln Eine Funktion, mit der sich die Anzahl der Zeilen einer Textdatei auch für große Dateien (mehrere MegaBytes) sehr schnell ermitteln lässt. | ||
Autor: Dieter Otter | Bewertung: | Views: 27.030 |
www.tools4vb.de | System: Win2k, WinXP, Win7, Win8, Win10, Win11 | Beispielprojekt auf CD |
Immer wieder taucht die Frage auf, wie man schnell die Anzahl der Zeilen einer Textdatei ermitteln kann.
Viele User gehen hierbei den "einfachsten" Weg, indem Sie die Textdatei öffnen den gesamten Inhalt auslesen und diesen in ein String-Array packen, um anschließend die Größe des Arrays abzufragen:
Dim Lines As String() = My.Computer.FileSystem.ReadAllText( _ Filename, System.Text.Encoding.Default).Split(vbCr) Dim LineCount As Integer = Lines.Length
Diese Methode funktioniert zwar zuverlässig, benötigt für große Dateien mit mehreren MegaBytes an Daten jedoch "zu viel" Zeit.
Nachfolgend möchte ich eine Funktion vorstellen, mit der sich die Anzahl der Zeilen um ein Vielfaches schneller ermitteln lässt. Die Datei wird hierbei blockweise in ein Byte-Array ausgelesen, wobei bei jedem Block-Lesevorgang dann die Anzahl der Umbruchzeichen in dem gelesen Byte-Arrayblock ermittelt werden.
''' <summary> ''' Ermittelt schnell die Anzahl Zeilen einer großen Textdatei ''' </summary> ''' <param name="Filename">Dateiname</param> ''' <returns>Anzahl Zeilen der Datei</returns> Public Function FileLineCount(ByVal Filename As String) As Integer Dim Lines As Integer = 0 Using oStream As New IO.FileStream(Filename, IO.FileMode.Open, IO.FileAccess.Read) ' Blockgröße Dim BlockSize As Integer = 16384 Dim Bytes(BlockSize) As Byte Dim ReadSize As Integer Dim StartIndex As Integer ' Datei blockweise auslesen, bis Dateiende erreicht Do ReadSize = oStream.Read(Bytes, 0, BlockSize) ' Anzahl Zeilenumbruchzeichen ermitteln StartIndex = -1 Do StartIndex = Array.IndexOf(Bytes, CByte(13), StartIndex + 1, ReadSize - StartIndex) If StartIndex >= 0 Then Lines += 1 Loop Until StartIndex < 0 Loop Until ReadSize = 0 oStream.Close() End Using Return Lines End Function