انجمن ویکی قلم‌های فارسی
ورود / عضویت

PDF

درمورد نرم‌افزارهای کاربردی مکینتاش

پاسخ: PDF

پستتوسط saeidk » 23 سپتامبر 2013, 17:55

جالبه که من می‌خواستم متن یه فایل pdf رو برگردونم به text عادی و پس از تلاش زیاد بهترینش همین Preview در شیرکوهی (و نه اسنو لئوپارد) بود بقیه هرکدوم یه مشکلی داشتن یعنی وقتی متن را کپی و پیست می‌کردم ترکیب لا به صورت ال می‌اومد یا جملات فارسی که وسطش متن انگلیسی بود به هم می‌ریخت. ولی توی Preview درست بود و حتی بهتر از ادوبی اکروبات پرو.
نماد کاربر
saeidk
 
پست‌ها : 1143
تاریخ عضویت: 17 دسامبر 2005, 19:20
محل سکونت: ایران-تهران

پاسخ: PDF

پستتوسط Behnam » 23 سپتامبر 2013, 18:27

چه جالب. رو این باید بیشتر بررسی کرد. شاید به این مربوط بشه که متن فارسی قبل از تبدیل شدن به PDF به چه صورت encoding شده بوده. آیا اون PDF روی مک ساخته شده بود یا فقط با Preview اون رو باز کردی؟ فکر می‌کنم اصل ماجرا هنگام ساخته شدن PDF رخ می‌ده.
نماد کاربر
Behnam
 
پست‌ها : 3534
تاریخ عضویت: 27 مه 2004, 04:44
محل سکونت: کانادا

پاسخ: PDF

پستتوسط saeidk » 23 سپتامبر 2013, 20:55

با مک ساخته نشده بود، پی‌دی‌اف یک کتاب بود که با ورد نوشته شده بود و بعد پی‌دی‌اف شده بود داشتم ساختن epub رو تست می‌کردم
viewtopic.php?f=26&t=2246&
با هر برنامه‌ای یه مشکلی بود یکی اینترهای ته خط رو می‌آورد اگر تنظیم می‌کردی که اینترها رو بی‌خیال شه باز یه جای دیگه مشکل پیش می‌اومد با Preview توی اسنولئوپارد تست کردم همون مشکل لیگچر لا رو داشت. خلاصه آخرش با Preview شیر کوهی شد. البته در عمل باید باز هم یک عالمه کار می‌کردی روی متن آمده از Preview. خلاصه تبدیل متن فارسی از ورد با یک کلیک امکان ندارد.
نماد کاربر
saeidk
 
پست‌ها : 1143
تاریخ عضویت: 17 دسامبر 2005, 19:20
محل سکونت: ایران-تهران

پاسخ: PDF

پستتوسط alireza3335 » 24 سپتامبر 2013, 00:39

بله. من این را چک کرده بودم. یعنی فایلی که با MS Word در ویندوز به PDF تبدیل شده بود در مک با Preview بسیار خوب کار می‌کرد و به راحتی می‌شد در آن جستجو کرد ولی همین فایل را وقتی کوچکترین تغییری مثل Highlight کردن انجام می‌دادی و سرانجام فایل ذخیره می‌شد بعد از باز شدن مجدد دوباره همان آش و همان کاسه.
علیرضا
نماد کاربر
alireza3335
 
پست‌ها : 677
تاریخ عضویت: 02 ژوئیه 2011, 16:15
محل سکونت: تهران

پاسخ: PDF

پستتوسط Ali.Rastegar » 26 سپتامبر 2013, 15:42

من مدتیه می‌خوام نکات مربوط به PDF و فارسی رو به اپل گزارش کنم، اما همونطور که می‌دونید گزارش اشکال نیاز به این داره که دقیقا بدونید در چه شرایطی مشکل پیش میاد و چطور میشه بازتولیدش کرد. اما من هر موردی که میخوام گزارش کنم هر فایل با فایل دیگه متفاوته و رفتار Preview هم دائم عوض شده، نمی‌تونم دقیقاً دست بذارم روی نقطهٔ اشکال.
متاسفانه حتی وقتی دقیقاً نقطهٔ اشکال رو مشخص کردم(مثل مشکل غیب شدن نام ماه در منوبار، در صورت استفاده از فرمت Persian)، باز هم سالهاست مشکل برطرف نشده، چه برسه به اینکه بخوام یک گزارش اشکال مبهم داشته باشم!
MacBook Pro 2015
نماد کاربر
Ali.Rastegar
Site Admin
 
پست‌ها : 2878
تاریخ عضویت: 26 مه 2004, 12:45

پاسخ: PDF

پستتوسط Behnam » 26 سپتامبر 2013, 16:16

فکر می‌کنم باید از یک گزارش خیلی پایه‌ای (basic) شروع کرد.
مثلاً من همین نوشتهٔ تو رو کپی کردم روی TextEdit، یکبار با گزینش UTF-8 و یکبار با گزینش MacRoman در encoding. بعد در هر دو مورد PDF خروجی پرینت کردم (گزینش Open PDF in Preview).
بعد در هر دو فایل PDF یک واژه رو انتخاب کردم. در این مورد واژهٔ «می‌دونید». دقت کن که در PDF با دوکلیکه کردن روی واژه select نمی‌شه. باید موش رو از اول تا آخر کلمه کشید تا انتخاب بشه. این خودش یک علامت اشکال در encoding هست.
وقتی «می‌دونید» select شد، اون رو کپی پیست کردم در جعبهٔ جستجوی پنجرهٔ PDF. اونجا شیوه‌ای که «می‌دونید» encode شده آشکار می‌شه که اتفاقاً در هر دو مورد متن اصلی به صورت UTF-8 و MacRoman هیچ فرقی نداره. (این فکر می‌کنم خبر خوبی باشه!)
پیوست‌ها
PDF encoding.jpg
نماد کاربر
Behnam
 
پست‌ها : 3534
تاریخ عضویت: 27 مه 2004, 04:44
محل سکونت: کانادا

پاسخ: PDF

پستتوسط Ali.Rastegar » 26 سپتامبر 2013, 17:11

بهنام جان اینطور که به نظر میاد اوضاع روی موریکس بهتر شده، متن خودم رو به TextEdit بردم و PDF گرفتم، مثل تصویر ضمیمه شد.
persian-pdf-mavericks.png
MacBook Pro 2015
نماد کاربر
Ali.Rastegar
Site Admin
 
پست‌ها : 2878
تاریخ عضویت: 26 مه 2004, 12:45

پاسخ: PDF

پستتوسط Behnam » 26 سپتامبر 2013, 17:27

آره ظاهراً دارند روش کار می‌کنند. ولی این از قضایایی هست که «یک کم حاملگی» برنمی‌تابد! واژهٔ «می‌دونید» در تمامیت خودش نه قابل تشخیص است و نه قابل جستجو.
نماد کاربر
Behnam
 
پست‌ها : 3534
تاریخ عضویت: 27 مه 2004, 04:44
محل سکونت: کانادا

پاسخ: PDF

پستتوسط Ilia » 26 سپتامبر 2013, 18:04

راه ایجادش اینطوریه:

۱-نوشته رو از تکست ادیت بصورت PDF سیو کنید.
۲- PDF رو روی Preview باز کنید.
۳- نوشته رو از PDF کپی کنید.
۴- دوباره در برنامهٔ Text Edit پیست کنید.

(مطابق عکس زیر که در لاین انجام شده:)
ArabicTextEncodingProblemInPDF.jpg
نماد کاربر
Ilia
Site Admin
 
پست‌ها : 6175
تاریخ عضویت: 25 سپتامبر 2006, 01:01
محل سکونت: کانادا

پاسخ: PDF

پستتوسط Behnam » 26 سپتامبر 2013, 18:10

فکر می‌کنم در این مورد بخصوص، مشکل از ZWNJ باشد. Space هم اشکال دارد. اما توصیه می‌کنم که این نکته در گزارشت جنبهٔ «کمکی» داشته باشد. اصل قضیه این است که یک واژه در تمامیت خود با دو کلیکه کردن انتخاب نمی‌شود و پاره‌های آن واژه در متن جستجو می‌شود. در یک متن انگلیسی اگر واژهٔ word را سرچ کنی، برایت تمام حروف W و O و R و D را جداگانه پیدا نمی‌کند. تنها واژه‌هایی را پیدا می‌کند که در آن ترکیب word وجود داشته باشد. اگر امید داشتم که اپل خودش با مشاهدهٔ نمونهٔ «می‌دونید» مشکل ZWNJ را کشف کند، می‌گفتم اصلاً دربارهٔ آن چیزی نگو! ولی چندان امیدی ندارم! ضمناً نمی‌خواهم که ZWNJ ذهن آنها را منحرف کند. اصل قضیه این است که مانند نمونهٔ انگلیسی word که گفتم، اجزای حروف جداگانه جستجو نشوند و کل کلمه با دوکلیکه کردن قابل انتخاب باشد.
نماد کاربر
Behnam
 
پست‌ها : 3534
تاریخ عضویت: 27 مه 2004, 04:44
محل سکونت: کانادا

پاسخ: PDF

پستتوسط Ali.Rastegar » 26 سپتامبر 2013, 21:45

ممنون از ایلیا و بهنام.
متاسفانه هنوز مشکل اتفاقات غیر قابل پیش‌بینی سر جاشه:
- دفعهٔ اول متن رو کپی کردم به TextEdit، از اونجا PDF گرفتم و بعد کپی کردم به TextEdit. با قلم جیزه پرو. حاصلش این شد که خط‌هایی که توش یک کلمه ZWNJ داشت همه حروف به هم چسبیده بود، اما باقی خطها درست بود.

- دفعهٔ دوم نیم‌فاصله‌ها رو حذف کردم و دوباره خروجی PDF گرفتم. بعد از PDF کپی کردم به TextEdit. تمام متن درست کپی شد، فقط در مورد ی کوچیک(ٔ) مشکل داشت و پرانتزها برعکس بود.

- دفعهٔ سوم متن رو با XB Niloofar با وجود ZWNJ تبدیل به PDF کردم و دوباره به TextEdit. اینبار همون متن شبیه عکس ایلیا چندین مورد تکرار حروف رو داشت، اما تعداد تکرارها کمتر بود و با ی کوچیک هم مشکلی نداشت (فایل niloofar.pdf رو ببینید).

- دفعهٔ چهارم دوباره با جیزه امتحان کردم، اینبار ZWNJ رو هم باقی گذاشتم، اینبار هیچ مشکلی با ZWNJ نداشت و اگر روی کلمات فایل PDF دوبار کلیک کنید به درستی انتخاب میشن!! (فایل geeza.pdf رو ببینید)

تا الان به این نتیجه رسیدم که با قلم‌های متفاوت مشکل خودش رو کاملاً متفاوت نشون میده، اما سر در نمیارم که چرا تست اول جیزه با تست چهارم کاملاً متفاوت از آب در اومد!
پیوست‌ها
geeza.pdf
(35.23 KiB) دانلود 843 بار
niloofar.pdf
(24.71 KiB) دانلود 861 بار
MacBook Pro 2015
نماد کاربر
Ali.Rastegar
Site Admin
 
پست‌ها : 2878
تاریخ عضویت: 26 مه 2004, 12:45

پاسخ: PDF

پستتوسط Ali.Rastegar » 26 سپتامبر 2013, 21:52

ظاهرا یکی از دلایل تفاوت تست ۱ و ۴ اینه که متن رو از سفاری کپی کردم و در مورد اول فکر کنم فرمت متن رو حفظ کردم، در تست چهارم اما از اول زدم Paste and Match Style، هیچ نکتهٔ دیگه‌ای به ذهنم نمی‌رسه!
MacBook Pro 2015
نماد کاربر
Ali.Rastegar
Site Admin
 
پست‌ها : 2878
تاریخ عضویت: 26 مه 2004, 12:45

پاسخ: PDF

پستتوسط Ilia » 26 سپتامبر 2013, 22:16

علی جان،
سرچ کردن یا سلکت کردن، مشکل ثانویه‌ایه که از این بهم ریختن و تکرار حروف و کلمات پیش میاد. مشکل اصلی رو بایستی ریکاوری تکست عربی از PDF ساخت سیستم اپل عنوان کرد. اگر این حل بشه، باقی بالطبع برطرف میشه.
چیزی که هست اینه که پرویوو یک چیز نشون میده و نوشتهٔ داخل پی دی اف اصلا یک چیز دیگه است. این رو بچسب.
--------
در ضمن بیربط با این موضوع نیست:
در لیبره آفیس میشه وقتی که فایل رو بصورت PDF اکسپورت میکنید، از اون بخواهید که داکیومنتش رو در اون embed بکنه!
که باعث میشه که حداقل با خود لیبره آفیس این مشکل رو نداشته باشه.
پیوست‌ها
Libre_PDF.png
نماد کاربر
Ilia
Site Admin
 
پست‌ها : 6175
تاریخ عضویت: 25 سپتامبر 2006, 01:01
محل سکونت: کانادا

پاسخ: PDF

پستتوسط Ali.Rastegar » 26 سپتامبر 2013, 22:33

درسته ایلیا جان، اما وقتی کلمه به درستی قابل انتخابه کپی هم درست انجام میشه. الان روی نسخه‌های قبلی OS X وقتی متن فایل geeza.pdf رو کپی می‌کنی چه اتفاقی میفته؟
MacBook Pro 2015
نماد کاربر
Ali.Rastegar
Site Admin
 
پست‌ها : 2878
تاریخ عضویت: 26 مه 2004, 12:45

پاسخ: PDF

پستتوسط Behnam » 26 سپتامبر 2013, 22:48

فکر می‌کنم ریپورتی که ایلیا می‌گه بهترین شروع باشه.
حالا من تو این هیر و ویر یک چیز جالب کشف کردم!
Ali.Rastegar نوشته است:[نمایش]
ظاهرا یکی از دلایل تفاوت تست ۱ و ۴ اینه که متن رو از سفاری کپی کردم و در مورد اول فکر کنم فرمت متن رو حفظ کردم، در تست چهارم اما از اول زدم Paste and Match Style، هیچ نکتهٔ دیگه‌ای به ذهنم نمی‌رسه!

من چون در تستم متن تو رو از سفاری کپی پیست کرده بودم زمینهٔ خاکستری داشت. برای برداشتنش TextEdit رو به Plain Text تبدیل کردم و دوباره برگردوندم به rtf. حالا که این رو می‌گی فکر کردم اگر به rtf تبدیل نمی‌کردم PDF از plain text چی از آب در می‌آمد. اینه که امتحان کردم و با تعجب متوجه شدم که در PDF واژه‌ها را با دوکلیکه کردن می‌شه انتخاب کرد و جستجو هم کل واژه رو پیدا می‌کنه!
اما مشکلش کماکان ZWNJ هست. ZWNJ فکر می‌کنم عامل این باشه که یک حرفی شش کیلومتر اونطرف‌تر اشتباهی encode می‌شه (این از مختصات اعصاب خرد کن باگ ZWNJ هست که هیچوقت اثر سوءش مستقیم و با ارتباط منطقی نیست).
مشکل space فکر نمی‌کنم جدی باشه چون این شیوهٔ معمول Preview هست که در سرچ مثلاً «Aperture 3» همهٔ واژه‌های Aperture و همهٔ اعداد 3 رو پیدا می‌کنه. در این نمونه در PDF از plain text من «که می‌دونید» رو select کردم و تو جعبهٔ جستجو گذاشتم. همونطور که می‌بینی تمام ترکیبات «که» و «می‌دونید» رو پیدا کرده. اما به اون چیزی که در جعبهٔ جستجو پِیست شده دقت کن. این دیگه plain text هست و ردخور نداره. شاید گزارش باگ رو باید از plain text شروع کرد. ضمناً یک متن plain text رو به PDF و دوباره به plain text تبدیل کردم تا ایده‌ای به دست بیاد.
پیوست‌ها
plain text.jpg
ke midoonid.jpg
نماد کاربر
Behnam
 
پست‌ها : 3534
تاریخ عضویت: 27 مه 2004, 04:44
محل سکونت: کانادا

قبلیبعدی


بازگشت به برنامه‌های مک


کاربران حاضر در این انجمن: بدون کاربران آنلاین و 17 مهمان