mgboard.de
https://mgboard.de/

Volltexterschliessung der Werkstattunterlagen zur Suche
https://mgboard.de/viewtopic.php?f=4&t=10817
Seite 1 von 1

Autor:  hein [ Sa 9. Mai 2015, 11:20 ]
Betreff des Beitrags:  Volltexterschliessung der Werkstattunterlagen zur Suche

Hallo zusammen,
die MG Werkstattunterlagen haben ja Ähnlichkeit mit dem Auto, man findet nichts - weil das PDF nicht durchsuchbar ist.

Um das zu umgehen, kann man beispielsweise mit dem PDF Xchangne Viewer, Download z.B. hier:

http://www.heise.de/download/pdf-xchange-viewer.html ( Bei der Installation eventuelle Addware abwählen )

im Menü Dokument-> Text erkennen eine Zeichenerkennung über das PDF laufen lassen, und als zusätzliche Ebene im PDF ablegen, das Ganze dann unter neuem Namen speichern - et Voila:

Vielleicht gibts den Tipp hier auch schon, dann einfach ignorieren ;-)

Dateianhänge:
Zwischenablage02.jpg
Zwischenablage02.jpg [ 98.27 KiB | 5325-mal betrachtet ]

Autor:  Reinheit [ Sa 9. Mai 2015, 15:03 ]
Betreff des Beitrags:  Re: Volltexterschliessung der Werkstattunterlagen zur Suche

Das Tool ist sicher gut, aber kann man pdfs nicht sowieso im Adobe Reader durchsuchen? Bei mir zumindest - in der englischen Version 10.1.3 unter OS X 10.6.8 - klappt das.

Autor:  hein [ Sa 9. Mai 2015, 15:06 ]
Betreff des Beitrags:  Re: Volltexterschliessung der Werkstattunterlagen zur Suche

Reinheit hat geschrieben:
Das Tool ist sicher gut, aber kann man pdfs nicht sowieso im Adobe Reader durchsuchen? Bei mir zumindest - in der englischen Version 10.1.3 - klappt das.


Bei mir klapp das auch, nur bei den Werkstatthandbüchern nicht, vielleicht gibts aber auch unterschiedliche Ausgaben.

Autor:  crimak42 [ Sa 9. Mai 2015, 18:39 ]
Betreff des Beitrags:  Re: Volltexterschliessung der Werkstattunterlagen zur Suche

Ein PDF besteht zum einen aus den Bilddaten - zum anderen nach OCR auch aus Text-Daten - fehlen letztere kann auch nix durchsucht werden. Dann helfen Tools die OCR für PDFs anbieten - leider tut der Adobe Acrobat Reader das mW nicht.... von daher super Tipp!

Autor:  Mykel [ Sa 9. Mai 2015, 18:41 ]
Betreff des Beitrags:  Re: Volltexterschliessung der Werkstattunterlagen zur Suche

Acrobat Pro müsste das können, mussichmaguggn ... :mrgreen:

Autor:  crimak42 [ Sa 9. Mai 2015, 18:43 ]
Betreff des Beitrags:  Re: Volltexterschliessung der Werkstattunterlagen zur Suche

Klar :) is nur ein biiiischen teuer :D

Autor:  hein [ Sa 9. Mai 2015, 18:45 ]
Betreff des Beitrags:  Re: Volltexterschliessung der Werkstattunterlagen zur Suche

Mykel hat geschrieben:
Acrobat Pro müsste das können, mussichmaguggn ... :mrgreen:


Ja, kann es, nur halt nicht für lau.
Insofern finde ich das andere ganz charmant.
Gibt warscheinlich auch noch andere Wege zum Ziel.

Autor:  Mykel [ So 10. Mai 2015, 13:04 ]
Betreff des Beitrags:  Re: Volltexterschliessung der Werkstattunterlagen zur Suche

Hab da mal ein bisschen rumprobiert ... betroffen sind nur die MGF Handbücher, die vom TF sind ohnehin problemlos.

Allerdings scheinen bei den MGF Handbüchern (englisch wie deutsch) spezielle Schriftarten verwendet worden zu sein, denn es handelt sich im PDF schon um Text, den Acrobat also nicht „texterkennen“ kann. Die Liste der Schriftarten ist jedenfalls etwas kurios:
Dateianhang:
Bildschirmfoto 2015-05-10 um 12.45.18.png
Bildschirmfoto 2015-05-10 um 12.45.18.png [ 98.47 KiB | 5239-mal betrachtet ]

Das sind – so wie ich das sehe – Schriften, deren Zeichen anders belegt sind, also sozusagen verschlüsselt, und davon auch noch mehrere unterschiedliche. Trotzdem ist es eben Text. Daher kommt Acrobat dann auch mit der Meldung
Dateianhang:
Bildschirmfoto 2015-05-10 um 12.36.36.png
Bildschirmfoto 2015-05-10 um 12.36.36.png [ 44.81 KiB | 5239-mal betrachtet ]

eine neue Texterkennung funktioniert nur, wenn man den Kram zuerst als Bild exportiert, dann wieder importiert und dann die Texterkennung laufen lässt. Hab ich mal für ein paar Seiten gemacht, ist aber recht langwierig. Für die 18 Seiten zum Thema Zahnriementausch habe ich gut 5 Minuten gebraucht (2 x 2 GHz, 8 GB RAM, MacOS X Yosemite, Acrobat Pro 10.1). Dateigröße war dann 9 MB, also etwa 500 kB je Seite. Mit der Option „verkleinerte Dateigröße“ waren’s dann nur noch 2,8 MB, aber das braucht noch Mal ne gute halbe Minute für die paar Seiten. Funktioniert dann aber tadellos; wer dann noch Zeit hätte, könnte auch noch die Inhaltsverzeichnisse klickbar machen. :mrgreen:

Eventuell gibt es da aber auch mittlerweile mehrere Versionen der Handbücher im Netz, die schon „richtige“ Bilder sind ...

Autor:  Dieter [ So 10. Mai 2015, 21:17 ]
Betreff des Beitrags:  Re: Volltexterschliessung der Werkstattunterlagen zur Suche

Die ersten Handbücher waren mit PDF- Verschlüsselung auf den RAVE CD's gespeichert. Daher dürften die *komischen* Schriftarten kommen. Hab damals noch rumgemoppert, das es besser gewesen wäre die ganze Energie in korrekte Dokumentationen zu legen, anstatt die CD's so sicher wie Fort-Knox zu machen.

Autor:  Mykel [ So 10. Mai 2015, 22:12 ]
Betreff des Beitrags:  Re: Volltexterschliessung der Werkstattunterlagen zur Suche

:lol: :lol: :up:

Autor:  hein [ So 10. Mai 2015, 23:19 ]
Betreff des Beitrags:  Re: Volltexterschliessung der Werkstattunterlagen zur Suche

Ok, ich hatte dann scheinbar das Glück, eine neuere Version zu haben.
Da funktioniert OCR sowohl mit Acrobat als auch mit der ursprünglich genannten Lösung.

Seite 1 von 1 Alle Zeiten sind UTC + 1 Stunde [ Sommerzeit ]
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
http://www.phpbb.com/