Visiting UL
Iei am fost în vizită la University of Limerick, unde lucrează mama, să mă întâlnesc cu niște colegi de ai ei, să mă sprijine un pic cu îndrumare pentru proiectul meu de doctorat. Am mai fost în vizită la UL (și am mai spus că e beton), dar acum, după ce am terminat și eu facultatea, m-a lovit ca un loc excelent de a face școală :)
Am fost pe la bibliotecă, care are mai multe etaje, și mese cu prize de laptop, și un sistem automat de împrumutat / returnat cărți. Pentru comparație, biblioteca din EC-uri de la noi de la facultate este o cameră un pic mai mare decât laboratorul nostru, în care spațiul pentru studenți are 2mp, în care e veșnic întuneric și dacă vrei acces trebuie să mergi la Polizu la gară să te "ia în evidență". Oh yeah!
Am fost și am vorbit jumatate de ora cu Mikael Fernstrom, care este șerif pe auditory stuff, și care m-a îndrumat spre mai multe chestii de citit, și de experimentat, și am primit de citit chiar și o teză de doctorat care prezintă un posibil setup pentru realizat experimente pe sunet într-un mediu virtual :D
PS. de obicei iarba este mult mai verde decât este acum, e foarte frig pentru Irlanda, toată iarna a fost așa :P
Doctorat progress
Am tot zis că o să vorbesc un pic aici despre proiectul meu de doctorat și în ce stadiu suntem acum cu el. Here goes.
Tema generală a proiectului este conversia imaginii în sunet, cu aplicații în ghidarea nevăzătorilor. Adică vrem să transmitem unui nevăzător un sunet care să descrie scena pe care o are în față, în sunet. De aici, pornind de la conceptul de brain plasticity, sperăm ca nevăzătorii să poată să își re-antreneze zona din creier responsabilă cu captarea imaginii pentru a prelucra informația sonoră pe care o suprapunem noi sunetelor existente. Există ceva cercetare în domeniul ăsta, și eu sunt în procesul de a descoperi exact câtă și ce rezultate are.
Între timp, ne-am propus să facem niște teste, să ne facem o imagine asupra diferitelor abordări posibile. Continuând munca începută de Alex Iordan la proiectul lui de diplomă, am scris o aplicație care folosește gstreamer (pentru captură), PIL (pentru procesare imagine), glade și pygtk (pentru interfață) și pyaudiere (pentru generare sunet), pe care să o putem folosi în teste. Mi-a luat ceva vreme până am citit toate cele, dar acuma merge destul de ok.
În principiu, preiau imaginea de la un webcam, o trec în grayscale și apoi în imagine binară (alb / negru). Pe imagine definesc macropixeli (pentru a mă ajuta cu viteza de procesare :P) în funcție de care decid dacă imaginea pe care o văd este în interiorul unei ținte, dacă am prins și din țintă și din fundal sau daca văd doar fundal. Evident, testele sunt extrem de simple, cu doar două culori, ținta și fundalul, și doar două dimensiuni.
Obiectivul testelor de acum este de a vedea dacă prin mișcarea capului și limitarea puternică a dimensiunii imaginii poți să îți dai seama care sunt formele pe care le ai în față (curbe, unghiuri drepte, colțuri, dimensiuni ...). Săptămâna trecută, înainte să plec la Alba, am făcut un prim rând de teste, și a mers destul de bine. Evident, sunt și lucruri care nu au mers atât de bine (spre exemplu, sunetul pentru cele trei cazuri posibile este continuu și înnebunitor), dar pentru asta avem versiunea 0.02 :P
Astăzi am făcut partea de binarizare și m-am mai jucat un pic cu pyaudiere pentru generarea de sunet intermitent.
Deși proiectul ăsta este mai puțin despre software decât despre alte chestii, ta-daaa, un screenshot din varianta curentă a aplicației:
IATED2010, Valencia
În ultimele două săptămâni am contribuit, cât am putut, la două lucrări pentru INTED2010 (International Technology, Education and Development Conference). Point is că am cedat drepturile de autor pentru ambele texte, aș vrea totuși să notez pe scurt ideile principale:
Overusing the Internet - problems in technical education descrie problemele pe care departamentul în care sunt doctorand se confruntă când vine vorba de rezolvări ale diferitelor teme și proiecte, multe din ele fiind inspirate puternic din ce se găsește pe Web. În principiu este vorba despre dezamăgirea noastră că toată lumea merge pe calea cea mai ușoară, și că oamenii sunt foarte creativi când vine vorba de orice altceva decât ce și-au ales, cu mâna lor, să învețe.
Education by research - descrie implicarea studenților la diferite nivele ale pregătirii lor (anul 4, masteranzi) în diverse activități de cercetare, în cadrul unui proiect mai mare care se desfășoară în departament.
Anyway, a durat o grămadă de vreme și o grămadă de recitiri până când am ajuns la forme cu care să fim mulțumiți :) Între 8 și 10 martie voi fi la Valencia să susțin lucrările în cadrul conferinței :D
New toy :D
Am tot zis că o să scriu despre ce fac pentru doctorat, dar tot n-am apucat. Dar o să scriu. Ideea e că astăzi a venit în sfărșit noul webcam (că webcamul vechi eram cam pușcat), un Canyon CNR-WCAM813 cu 50 de lei de la eMag, Acuma, ideea a fost să construim un dispozitiv experimental (adică cu care să putem face experimente) în care webcam-ul să vadă ce văd eu, inclusiv când îmi mișc capul. Ne-am gândit la un sistem stil frontală (pentru ne-munțomani, frontala îi lanterna aia ce ți-o pui pe cap :P), care probabil va fi și soluția finală, dar pentru prima tură de experimente am folosit o șapcă, primită sponsorizare de la cei cinci care au rămas patru (mulțumeeesc).
Un pic de bormașina, niște prinzătoare de plastic, și, taaa-daaaa:
La primele teste, inclusiv unghiul camerei este bun, as in centrul imaginii este drept în fața mea :) One more picture:
Idei de licențe
Înainte să plec la Vienna, am avut o discuție cu profu' despre cum ar trebui să abordez tema de doctorat și una din chestiile ce le-am decis e că am putea să propunem niște teme de licență, să mai împart ce am eu de descoperit / inventat la mai mulți.
So, până acum am stabilit în linii mari trei idei de teme de licență:
- Recunoaștere de texte din imagini aleatoare, în principal din outdoor (nume de străzi, firme, reclame, anunțuri, numere de mașină). Tema are două elemente, unul este stabilirea existenței unei forme de text într-o imagine (într-un mod eficient) și al doilea este recunoașterea textului efectiv (care poate fi deformat în mai multe feluri, din cauza poziției, sau a suportului - i.e. un stâlp rotund, sau să fie de sus în jos ...)
- Transformarea de forme geometrice în sunet. Stabilirea unei metode (experimentale) prin care un set de forme geometrice în sunet. Formele geometrice pot fi de la simple (gen un dreptunghi, un disc) la lucruri mai complicate, dar toate vor fi bicolore.
- Determinarea distanței față de un obiect dat și a poziției obiectului într-un cadru prin analiza dimensiunii obiectului, într-un flux video live, și transmiterea acestei informații pe un canal audio către un utilizator.
O regulă importantă este că ne dorim să dezvoltăm / folosim algoritmi independenți de limbaj și platformă, folosind tehnologii opensource. N-aș vrea să avem programe în Matlab folosind biblioteci proprietare (ca să nu mai spunem hackuite).
Dacă sunteți interesați de așa ceva, sau poate știți pe cineva care ar putea fi, dați un semn. Revin cu detalii după ce mai stabilesc chestii.
Rezumaaat
Am avut câteva zile destul de pline, să zic așa :). Am înaintat puțin cu lucrarea de doctorat, voi scrie un post separat despre ce am reușit și ce nu am reușit să fac, ideea e ca am mai făcut un pas :)
Aș vrea să spun că nu știu cum se descurcă oamenii care ies în oraș în fiecare seară. Am fost vineri, sâmbătă, luni și marți, și deja lista mea cu task-uri din categoria overdue nu mai încape pe ecran. Vineri am fost într-un local destul de ok, un loc de-ăla de știi dintr-o privire că o să te simți bine: polare peste tot (mă refer la haine, nu la vodci :P), ghete de munte de calitate, atmosferă voioasă, bere affordable, mese scorojite de lemn ... beton. Am băut și am povestit până când a adormit tineretul pe mese, și după aia am mai stat un pic și am plecat :D
În weekend am reușit două treburi worth mentioning. Am făcut și ultima plăcuță pentru modulele ZigBee (și o să revin cu o poză și mai multe detalii curând), care nu este un masterpiece, dar am învățat câteva lucruri foarte utile în utilizarea programului de făcut plăcuțe din gEDA, PCB.
Și am mai reușit să înaintez puțin în misiunea mea de a ghida nevăzătorii prin sunet pe un traseu bicolor (care este primul baby-step pe care trebuie să îl fac în doctorat). Vineri seara am avut un prototip foarte barbar gata, și m-am învârtit de nebun pe hol la facultate cu ochii închiși ca să mă pierd să pot să-l testez :)
Am mai făcut ceva worth mentioning, marți seara am condus și eu 500 de metri lumina păcii, adusă de la Vienna de Adi Secal și echipa lui. Nice :)
Idea
Le tot zic la prieteni ce nașpa e pista de biciclete din București, că e plină cu oameni și cu stații de autobuz și cu mașini parcate și cu oameni and so on. Și m-am mai gândit că dacă tot trebuie să îmi dezvolt aptitudinile de prelucrare video, asta ar fi un material bun pentru dedus un traseu (pentru că e între două benzi galbene :P).
So, vineri dimineața am legat un webcam de bicicleta mea Orbea și de netbooku de la robot, am băgat netbooku în rucsac și am zburat spre școală (întâmplarea face să fi avut o întâlnire la 8:15 la poli). Din păcate, pentru că mă grăbeam (și și pentru că îi complicat cu cablul și laptopu în spate și bicla între picioare și camera prinsă cu scai), nu am reușit să prind prea bine camera și era un pic cam în sus și totally nefocalizată.
Rezultatul este un total failure de 30 de minute și nu merită nici măcar să fie pe youtube.
Studiez metode mai fericite de înregistrare și revin cu o înregistrare beton, numa bună de procesat ;) Dacă are cineva experiență în chestii de-astea, drop me a line please :P







