vb@rchiv
VB Classic
VB.NET
ADO.NET
VBA
C#
sevDataGrid - Gönnen Sie Ihrem SQL-Kommando diesen krönenden Abschluß!  
 vb@rchiv Quick-Search: Suche startenErweiterte Suche starten   Impressum  | Datenschutz  | vb@rchiv CD Vol.6  | Shop Copyright ©2000-2025
 
zurück

 Sie sind aktuell nicht angemeldet.Funktionen: Einloggen  |  Neu registrieren  |  Suchen

VB.NET - Ein- und Umsteiger
Re: PDF nach bestimmten Inhalten durchsuchen und betreffende Seite speichern. 
Autor: DerAndi
Datum: 27.08.14 16:19

Hallo Kiki,

musste ein wenig länger suchen. Tut mir leid... die Ordnung ;)

Hier der versprochene Code. Mit diesem kannst Du ein PDF Dokument bearbeiten und den Text, der sich auf einer Seite befindet auslesen. Du musste für dich dann nur eine Funktion noch aufbauen, mit der Du deine Parameter bzw. die gesuchten Werte bestimmen kannst.

In diesem Beispiel lese ich den Text aus einem 40 seitigen PDF Dokument aus.

Btw.:
Nein, ich bin da auch kein Profi arbeite mich aber derzeit in dieses Tool ein wenig hinein.

Imports iTextSharp.text.pdf
Imports iTextSharp.text.pdf.parser
Imports System.Text
 
Module Module1
 
    Sub Main()
        Call PDFText("d:\dallas 1-wire application note.pdf")
    End Sub
 
    Private Sub PDFText(PDFDateiname As String)
        If IO.File.Exists(PDFDateiname) = False Then Exit Sub
 
        Dim Seitentext As String = ""
 
        ' Wie der Text extrahiert werden soll...
        Dim m_Strategie As New SimpleTextExtractionStrategy()
 
        Using myPDFReader = New iTextSharp.text.pdf.PdfReader(PDFDateiname)
 
            For iSeite As Integer = 1 To myPDFReader.NumberOfPages Step 1
                ' ...auslesen
                Seitentext = PdfTextExtractor.GetTextFromPage(myPDFReader, _
                  iSeite, m_Strategie)
 
                ' ...Zeichenkodierung anpassen
                Seitentext = Encoding.UTF8.GetString( _
                                ASCIIEncoding.Convert( _
                                        Encoding.Default, _
                                        Encoding.UTF8, _
                                        Encoding.Default.GetBytes(Seitentext)))
 
                Console.WriteLine(Seitentext)
            Next
 
        End Using
 
    End Sub
 
End Module
alle Nachrichten anzeigenGesamtübersicht  |  Zum Thema  |  Suchen

 ThemaViews  AutorDatum
PDF nach bestimmten Inhalten durchsuchen und betreffende Sei...6.105kiki271122.08.14 08:20
Re: PDF nach bestimmten Inhalten durchsuchen und betreffende...5.114DerAndi24.08.14 17:45
Re: PDF nach bestimmten Inhalten durchsuchen und betreffende...5.091kiki271124.08.14 18:46
Re: PDF nach bestimmten Inhalten durchsuchen und betreffende...5.195DerAndi27.08.14 16:19

Sie sind nicht angemeldet!
Um auf diesen Beitrag zu antworten oder neue Beiträge schreiben zu können, müssen Sie sich zunächst anmelden.

Einloggen  |  Neu registrieren

Funktionen:  Zum Thema  |  GesamtübersichtSuchen 

nach obenzurück
 
   

Copyright ©2000-2025 vb@rchiv Dieter Otter
Alle Rechte vorbehalten.
Microsoft, Windows und Visual Basic sind entweder eingetragene Marken oder Marken der Microsoft Corporation in den USA und/oder anderen Ländern. Weitere auf dieser Homepage aufgeführten Produkt- und Firmennamen können geschützte Marken ihrer jeweiligen Inhaber sein.

Diese Seiten wurden optimiert für eine Bildschirmauflösung von mind. 1280x1024 Pixel