كيفية تحويل نصوص OCR إلى PDF بالأبيض والأسود
تعتبر ملفات PDF من أكثر الصيغ شيوعًا لتبادل المستندات، ولكن في بعض الأحيان نواجه تحديات مثل استخراج الصور أو تحويل النصوص الممسوحة ضوئيًا إلى ملفات PDF بسيطة. في هذا المقال، سنتناول طرق تقليد نتيجة "نسخ الصورة" من برنامج Evince على نظام Ubuntu، بالإضافة إلى كيفية تحويل النصوص الممسوحة ضوئيًا إلى ملفات PDF بالأبيض والأسود فقط.
نسخ الصور من PDF باستخدام Evince
برنامج Evince هو عارض PDF شائع على نظام Ubuntu، ويتيح للمستخدمين نسخ الصور والنصوص بسهولة. عند استخدام خيار "نسخ الصورة"، فإن Evince يقوم بنسخ الصورة بوضوح وتحويل النصوص إلى شفافية، مما يعني أن الخلفية ستكون شفافة ولن تؤثر على جودة الصورة. لتحقيق نفس النتيجة عند العمل على ملف PDF، يمكن استخدام أدوات متاحة في Ubuntu لتحرير أو تحويل المحتوى.
الخطوات المطلوبة لتقليد الصورة الناتجة
للقيام بذلك، يمكنك استخدام أدوات مثل Inkscape أو GIMP، والتي تسمح لك بالتعامل مع الطبقات وفصل النص عن الخلفية. أولاً، قم بفتح ملف PDF باستخدام Inkscape واختر الصورة التي ترغب في استخراجها. ستتمكن من رؤية الطبقات المختلفة، مما يمنحك السيطرة على ما تريد الحفاظ عليه وما تريد إزالته. بعد ذلك، يمكنك تصدير الصورة بالشكل الذي ترغب به.
ولكن إذا كنت تبحث عن طريقة أكثر مباشرة، يمكنك تجربة استخدام أدوات سطر الأوامر مثل ImageMagick أو pdftoppm. يتيح لك ImageMagick تحويل صفحات PDF إلى صور، مما يمكنك من استخراج الصورة وتحويلها وفق ما تراه مناسبًا.
تحويل النصوص الممسوحة إلى PDF بالأبيض والأسود
قد نحتاج أحيانًا إلى تحويل نصوص تم مسحها ضوئيًا إلى ملف PDF بالأبيض والأسود. هذا الأمر يمكن أن يكون مهمًا للغاية لأغراض الأرشفة أو الطباعة. الخطوة الأولى في هذه العملية هي استخدام برنامج OCR (التعرف الضوئي على الأحرف)، مثل Tesseract. يقوم هذا البرنامج بتحويل النصوص الممسوحة إلى نصوص قابلة للتحرير، مما يسهل إدراجها في مستند PDF.
خطوات التحويل إلى PDF بالأبيض والأسود
بعد استخدام Tesseract لاستخراج النص، يمكنك استخدام أدوات مثل Pandoc أو Ghostscript لتوليد ملف PDF. يتم تحويل النص المستخرج إلى ملف PDF، ويمكنك استخدام Ghostscript لتحويله إلى صيغة بالأبيض والأسود. الأمر يكون كما يلي:
gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dNOPAUSE -dQUIET -dBATCH -sOutputFile=output.pdf input.pdf
تتيح لك هذه الأوامر إنشاء ملف PDF بجودة عالية، مع الحفاظ على النص واضحًا وقابلًا للقراءة.
تجميع كل الخطوات السابقة
إجمالاً، يمكنك استخدام الطرق المذكورة لتقليد نتيجة "نسخ الصورة" من Evince، بالإضافة إلى تحويل النصوص الممسوحة إلى PDFs بسيطة. سواء كنت تستخدم أدوات الجرافيك مثل Inkscape أو أدوات سطر الأوامر، فإن كل منها يوفر لك مجموعة متنوعة من الخيارات لتحقيق هدفك.
بهذا الشكل، ستتمكن من التعامل مع ملفات PDF بشكل أكثر فعالية وفق احتياجاتك. نأمل أن تكون هذه المعلومات قد وفرت لك رؤية واضحة حول كيفية استخدام Ubuntu مع Evince، للتحكم في الملفات بطريقة أكثر دقة وكفاءة.