Amir_S نوشته است:[نمایش]فکر کنم تقریبا یک هفته شده که گوگل پروژه یادگیری ماشینیاش را «باز» اعلام کرده. دوست دارم نظر پوریا را در مورد آن و تأثیرش روی کسب و کار شرکتشان بدانم.
http://www.tensorflow.orghttps://github.com/tensorflow/tensorflow
منظور امیر
https://www.graphiq.com ـه، و بهطور خاص،
https://www.graphiq.com/search (که اگر ۴-۵ دسامبر بازش بکنید تغییرات اساسیای خواهد داشت و خیلی بهتر میشه).
چه تاپیک مناسبی برای طرح موضوع... چون هدف نهایی، رقابت با Google Now و Wolfram Alpha و Siri و مشابهاتشونه! و حالا که بحثش باز شده، فکر کنم بیربط نباشه اگر یک پست طولانیِ تبلیغاتی در موردش بدم
من متأسفانه خیلی در مورد TensorFlow (که toolkit ـی برای machine learning یا چیزی که بیشتر مُد شدٔ، deep learning ـه) اطلاع ندارم، اما چنین ابزارهایی قطعاً به ما کمک میکنند. ساخت knowledge graph نیاز به داشتن اطلاعات خام و ساختاربندیشده داره (knowledge graph گوگل شامل حدود ۲۰ میلیارد و Graphiq شامل حدوداً ۱۱۰ میلیارد دادهٔ مجزاست!). برای جستجو در این knowledge graph (بهشکلی که بشه مثل Siri/Cortant/Watson/Google Now پرسید «اوباما چند سالشه» یا «نتیجهٔ بازی x و y چی شد»)، علاوه بر موارد بالا نیاز هست به «فهمیدن» چیزی که پرسیده شده (query understanding)، که از چیزی که ممکنه بهنظر بیاد بسیار مشکلتره!
مثلاً پرسش زیر (
انگلیسیش عمداً مشابه چیزی نوشته شده که کاربران در حالت عادی میپرسند) رو در نظر بگیرید:
«معاون اول بوش پدر چند سالشه؟ age of daddy bush's vice president»(اگر روی لینک بالا کلیک کنید صفحهٔ جستجو باز میشه، که خصوصاً روی دسکتاپ بسیار جالبه اگر روی visualization ـها کلیک بکنید که همه interactive هستند)
برای پاسخ دادن، باید اولاً بفهمید منظور از daddy bush، جناب H.W. Bush ـه که زمانی رئیسجمهور بوده، و یک vice president ـی داشته. این vice president، یک تاریخ تولد داره که باید از تاریخ سال جاری کم بشه تا جواب بهدست بیاد.
مثالی دیگه: «GDP کشوری که بلندترین ساختمان را دارد چقدر است؟ gdp of country with tallest building». علاوه بر پاسخ سؤال، لیست و چارتی از ساختمانهای بلند و اطلاعاتشون هم داده شدهاند.
«مقایسهٔ میزان رضایت مردم از اوباما و بوش obama vs bush approval rating»«پرفروشترین فیلمهای تارانتینو tarantino's highest grossing movie»، که علاوه بر دادن پاسخ صحیح، فیلمهای ایشون رو بهترتیب فروش در جدول و bar chart هم نشون میده.
«وزن درازترین دایناسور به کیلوگرم (بجای پوند) weight of tallest dinosaur in kg». علاوه بر جدول و چارتهایی که دایناسورها رو بهترتیب نزولی قد و وزن مرتب کرده، یک چارت (از نوع scatter plot) هم آورده شده که مقایسهٔ همزمان قد و وزن دایناسورهاست!
«مقایسهٔ تورم و نرخ مرگومیر نوزادان countries infant mortality rate vs inflation». اینجا scatter plot نمایشدادهشده نشون میده که وضع مرگومیر نوزادان در کشورهای با نرخ تورم بالا بدتره...
و اینیکی که واقعاً شاهکاره
«متوسط کیفیت دوربین و صفحهٔ نمایش گوشیها و تبلتهای اندرویدی که در سالی که برج خلیفه افتتاح شد، به بازار آمدهاند average camera and screen size of android phones and tablets released in year burj khalifa opened»برای مورد آخر، باید اولاً فهمید ساختمانی به نام برج خلیفه وجود داره، بعد سال اتمام ساختش رو بهدست آورد (۲۰۱۰)، بعد تمام تبلتهای اندرویدی ساخت ۲۰۱۰ و تمام گوشیهای اندرویدی سال ۲۰۱۰ رو بهدست آورد، بعد صفحهٔ نمایش و کیفیت دوربینشون رو میانگین گرفت. این مراحل در سمت راست تصویر زیر مشخص شدهاند:
تعداد دادههایی که در knowledge graph وجود داره بسیار زیاده، و احتمالاً حداقل ۷-۸ ماه دیگه طول میکشه تا همهٔ اطلاعات قابل جستجو باشند (چیزی که در بالا میبینید نتیجهٔ ۵ ماه کار توسط ۳ نفره). لینکهای زیر چند نمونه هستند که بهخوبی وسعتش رو نشون میدن... خصوصاً اگر روی کامپیوتر هستید بد نیست اگر ماوس رو روی چارتها و گرافها ببرید و باهاشون بازی کنید!
http://us-presidents.insidegov.com/l/2/Barack-Obamahttps://country-facts.findthedata.com/l/1/United-Stateshttp://smartphones.specout.com/l/2714/Apple-iPhone-6Shttp://listings.findthecompany.com/l/85 ... pertino-CAhttp://cars.axlegeeks.com/l/48066/2016- ... 4L-4cyl-9Aاطلاعاتی که سرشماری آمریکا در مورد نیم میلیارد(!) آمریکایی (۱۷۹۰ تا ۱۹۳۰) منتشر کرده:
https://us-census.mooseroots.com/ مثلاً
http://us-census.mooseroots.com/l/23954 ... rd-E-Small (که گرچه سالهاست مرده، اما تمام تاریخچهٔ زندگی و خانوادهش قابل جستجو هستند!)
http://colleges.startclass.com/l/1929/H ... Universityhttps://places.graphiq.com/l/15057/Santa-Barbara-CAhttp://listings.findthehome.com/l/51081 ... a-CA-93105http://nba-teams.pointafter.com/l/10/Go ... e-Warriorshttp://career-profiles.careertrends.com ... s-Softwarehttp://dogs.petbreeds.com/l/95/Labrador-Retrieverhttp://banks.credio.com/compare/1-42/We ... -Ally-Bankhttp://airlines.wanderbat.com/l/128/Qatar-Airwayshttp://tequila.underthelabel.com/l/229/ ... do-Tequilahttp://conditions.healthgrove.com/l/653/Measleshttp://movies.prettyfamous.com/l/21850/Steve-Jobs-2015تمام visualization ـهای سایتهای فوق رو میشه بهرایگان در وبسایتهای دیگه embed کرد (این کاریه که آسوشیتدپرس، یاهو، تایم و تعداد زیادی وبسایت دیگه انجام میدن):
پست (بهنظر من بسیار جالب!) زیر هم در مورد نحوهٔ طراحی و ساخت این visualization ـهاست:
https://medium.com/graphiq-engineering/ ... a14f098454(پایان پیام تبلیغاتی!)