arkadaşlar, ben bunu tyvt (türk yazılım veri tabanı) projesi kapsamında planlamıştım da bu ara hiçbirşeye vakit kalmadı hayatımda... Böyle duruyorum
Şöyle ki, dergileri indekslemek yetmeyecek. Daha kapsamlı bir proje lazım ki, dergilerin içeriklerini, ilgili materyallere linklemek gerekiyor. Ben JPG'ler üzerinde javascript/html5 yardımı ile regionlar oluşturarak, yazılımları dergi makalelerine linklemek, makaleleri de bağımsız ürünler olarak tanımlamak gibi aslında pek de zor olmayan bir şekilde çözmeye çalışmıştım. düşünün bir oyuna bakıyorsunuz ve kaç dergide kaç referans var, makaleden, reklama kadar herşeyi görüyorsunuz. Ya da dergideki bir sayfayı açıyorsunuz o sayfada bulunan tüm yazılımlara olan linkler aşağıda. Mümkünse download, yoksa yazılımın rapsheet'i çıkıyor karşına.
MYSQL veri tabanı da hazırlamıştım ve sunucuda oluşturmuştum
http://prntscr.com/7lrhw . Hatta pencereleri kodlamaya bile başlamıştım (test sayfasını buralara bir yere yapıştırmıştım) . Aslında 1 aylık bir çalışma ile süper çalışan bir sistem kurulabilir. Eğer biri bizden önce yapmazsa bir gün bitiririz...
retrojen niye var?
edit:
OCR güzel, mümkünse yapılmalı, ama kesin çözüm değil. Dergilerin manuel olarak yeniden indexlenmesi şart. Örneğin, bir fotograf da aramak isteyebilirsiniz. Ya da bir harita, bir tablo vs.