joi, 11 februarie 2010

O rugaminte pentru programatori

Am o rugăminte-slash-idee-slash-nevoie.

Eu programez în general în flex/actionscript. Ştiu. E un pic lame. Dar asta fac eu. Ar trebui să o fac în python, ca tot omul normal, dar n-o fac.

Problema e că flex-ul nu ştie decât de sqlite. Iar una din bazele de date pe care le doresc cu pasiune este în mysql.

E vorba de dexonline.

O vreau în sqlite pentru a putea face diferite chestii cu ea, chestii legate de data mining, text statistics şi alte idei. De exemplu, au acolo declinaţii -- ai putea transforma diferitele declinări ale unui cuvânt dintr-un text într-o singură rădăcină (stemming). Chestie foarte utilă când analizezi blogosfera/twitosfera românească. Sau ai putea căuta sinonime (deşi stă cam prost la capitolul ăsta -- apropo, am un dicţionar de sinonime (1980, câteva sute de mii de intrări) scanat. E cineva interesat?)

Există tooluri de conversie, dar au o problemă: ori costă bani ori, şi asta e mai important, nu ştiu să convertească diacritice.

Aşadar: există cineva care poate converti această bază de date mysql într-un sqlite, respectând diacriticele şi structura internă? Dacă da, aştept un link de download în comentarii :P


G.


3 comentarii:

marius spunea...
n-am lucrat cu sqllite, dar daca convertesti baza de date mysql in UTF (mysql 5+ ofera suport pt mail multe set-uri).. e ceva bataie de cap ca a trebuit sa o fac, dar merge.

am dat un search si am gasit 2 linkuri utile:
http://stackoverflow.com/questions/263056/how-to-change-character-encoding-of-a-pdo-sqlite-connection-in-php

http://www.sqlite.org/pragma.html#pragma_encoding
marius spunea...
n-am fost f clar..

vroiam sa zic sa convertesti in mysql baza de date mysql din latin-2 (iso-8859-2) in utf8. probabil poti sa faci asta automat cu phpmyadmin. cauta pe net si gasesti sigur.

dupa aia exporti baza de date si o importi in sqlite.
Cosmin spunea...
Mmmm sinonime, let them come to me :)