Si mund t’i qaset një makinë e vogël kërkimore në gjuhën Shqipe gjigantëve të sotëm të kërkimit? Duke e kuptuar gjuhën lokale, duke krijuar një shërbim të dedikuar për përdorues, dhe duke u mbështetë në teknologjitë e Microsoft Cloud.

Gjirafa

Për shumicën e sportdashësve që flasin gjuhën angleze, gjetja e rezultateve të ekipit të tyre të preferuar është aq e thjeshtë sa të shkruash emrin e ekipit në Bing apo Google. Rezultati momental i takimit zakonisht është në faqen e parë apo të dytë të kërkimit.

Gjërat s’janë aspak të thjeshta për sportdashësit shqipfolës. Përdorimi i makinës kërkimore për t’u informuar mbi lojën e fundit të ekipit, për shembull, mund të kërkojë disa kërkime. Madje edhe atëherë rezultati mund të mos gjendet, deri në faqen e dytë apo tretë të të kërkimit. Por ky mundim shkon përtej kërkimit të rezultateve të sportit për shqipfolësit në vendet si Shqipëria Kosova dhe Maqedonia. Ata në vazhdimësi e kanë të vështirë të gjejnë saktë çka do qoftë në Internet, duke filluar nga lajmet, motin apo vendet e lira të punës.

Mergim Cahani, ndërmarrës dhe zhvillues shqiptarë ka një ide të saktë se ku qëndron problemi.

“Makinat e mëdha kërkimore nuk i futen uebit Shqiptarë aq thellë, dhe arsyeja kryesore është vetë Gjuha” thotë ai. Shqipja në fakt, është gjuha më e dallueshme nga të gjitha gjuhët e botës për nga leksiku i saj, si dhe është një nga të paktat gjuhë që nuk rrjedh nga ndonjë gjuhë tjetër, thotë Cahani “që të procesohet kërkimi në mënyrë inteligjente, të duhen njohuri të thella të gjuhës në mënyrë që të analizohet teksti dhe të kuptohet plotësisht kërkimi”.

Cahani mendoi se mund të adresojë këtë çështje duke krijuar makinën kërkimore Gjirafa, veçanërisht për Shqip-folësit anë e mbanë botës. Mirëpo Cahani nuk i kishte resurset për të konkurruar në të njëjtin nivel me organizatat e mëdha të cilat e dominojnë kërkimin. Për të qenë një konkurrent i denjë, atij i nevojitej partneritet me një kompani të duhur dhe të përdorte teknologjinë më të zhdërvjelltë dhe të më të pasur me veçori.

Cloud është teknologjia që i prinë marrëdhënies në rritje të Gjirafës me Microsoft 

Qe nga fillimi i zhvillimit, Cahani është kthyer në teknologjinë që kishte përdorë në ditët e tij si student në qytetin e New York-ut.

“Unë gjithmonë kam përdorur veglat e Microsoft-it për të zhvilluar, përfshirë Visual Studio, sepse ato ma bënin jetën më të lehtë.” thotë ai. “Unë po ashtu kam provuar shumë vegla me kod të hapur (Open Source), ne mendimin tim ato nuk ishin aq të fuqishme dhe të thjeshta sa mjetet e bazuara në Windows”.

Duke përdorë Visual Studio dhe Microsoft Visual C#, Cahani krijoi versionin e hershëm të makinës kërkimore që përfshinte multi-threaded crawler, dhe përpunuesin e kërkimit. Në mënyrë që ai të ndërtoi atë, atij vetëm i nevojitej teknologjia që mundëson rritje.

Ishte koha kur Cahani mësoi për platformën Microsoft Azure Cloud.

“Kur Azure doli në treg, unë kisha qasje për ta provuar atë, dhe më pëlqeu ajo çka pashë ” thotë ai. “ E kuptova që Azure do të përkujdeset për infrastrukturën, ashtu që ne do të mund të rrisim resurset pa u brengosur fare”.

Edhe pse ai kishte testuar përdorimin e Amazon Web Services, ai ishte thelluar në Azure Search, një zgjidhje search-as-a- service qe i ndihmon zhvilluesve të integrojnë kërkimin në aplikacione pa u brengosur për infrastrukturën.

“Amazon ka diçka të ngjashme, por nuk krahasohet ne çmim dhe nuk integrohet aq lehtë me veglat e Microsoft të cilat unë i përdor” thotë Cahani.

Një Makinë e fuqishme kërkimore e bazuar në Azure

Cahani dhe një ekip prej katër zhvilluesish e kanë krijuar Gjirafa.com, makinën kërkimore për kërkim të plotë të tekstit të ueb faqeve, në gjuhën Shqipe dhe Angleze, të bazuar pothuajse tërësisht në Azure. Përveç Azure Search, aplikacioni përdorë shërbimet e Azure Cloud për pjesën e parme, si dhe makinat virtuale për skanimin e uebit. Cahani dhe ekipi i tij po ashtu përdorin shërbimin Azure Managed Cache, që është një zgjidhje e memories së shpërndarë që ofron qasje super të shpejtë në të dhëna. Për me tepër, Gjirafa ka filluar të shfrytëzojë Azure Machine Learning që të parashikojë fjalët e kërkimit.

“Nëse e shkruan një tekst për të kërkuar, do të mundohet të sugjerojë fraza kërkuese” thotë Cahani. “Ne ende nuk kemi një numër të mjaftueshëm të kërkimeve që të nxjerrim parashikime të vlefshme, megjithatë është premtuese.”

Gjirafa.com mbledhë më shumë se 15,000 artikuj të lajmeve në gjuhen Shqipe për çdo ditë, nga më shumë se 120 portale. Po ashtu ofron shërbim për të kërkuar mbi 45,000 linja të autobusëve në Shqipëri, Kosovë dhe Maqedoni, si dhe shpallje të vendeve të lira të punës, apo parashikimin e motit për ato regjione. Momentalisht faqja tërheqë 240,000 vizitorë mujorë, 2.2 milion shfletime mujore dhe në indeksin e saj ka mbi 33 milion ueb faqe. Me këtë ritëm të shpejtë të rritjes së Gjirafës, 1 milion vizitorë së shpejti do të jenë arritja e tyre e radhës. Çfarë e bën krejt këtë të funksionojë është Azure Search, “thotë Cahani.

“ Me Azure Search, ne kemi ndërtuar një super indeks kërkimi, dhe kemi disa algoritme të mira për rënkim të rezultateve, si dhe para-procesim të kërkimeve për gjuhën Shqipe në të cilën është duke punuar bashkëthemeluesi ynë Dr.Ercan Canhasi. Si rrjedhojë ne jemi duke ju ofruar informata tejet të rëndësishme më shume se 12 milion shqipfolësve anë e mbanë globit.

Diçka qe gjigandët nuk e kanë: të dhënat lokale dhe ekspertiza gjuhësore

Gjirafa ju ofron përdoruesve shqipfolës të Internetit diçka qe gjigandët si Google nuk mund të ofrojnë.

“Ne mund t’i ofrojmë përdoruesve tanë qasje të lehtë ne informata gjeografike lokale sepse ne mund ta skanojmë uebin shqip shumë thellë “ thotë Cahani. “Ne madje i shikojmë edhe faqet lokale të cilat Google mund t’i injoroje tërësisht”

Gjirafa gjithashtu dallohet me njohuri gjithëpërfshirëse të gjuhës Shqipe.

“Të përdorësh Azure Search për të para procesuar gjuhën, na mundëson të përcaktojmë kuptimin e saktë të frazës përpara se të kthejmë rezultatet e kërkimit” thotë Cahani. “Kjo se bashku me të dhënat lokale, nënkupton se ne e shërbejmë tregun Shqipfolës më mire sesa makinat e mëdha kërkimore.”

Përparësisë e të qenit i Vogël

Edhe pse Gjirafa ka vetëm 15 persona të punësuar, organizata mund të punojë më mire se konkurrentët e mëdhenj të kërkimit.

“Duke u mbështetur në Azure si infrastrukturë e jona, ne s’kemi nevojë të preokupohemi me menaxhim të harduerit, dhe ne mund të rritemi shumë shpejtë për aq sa kemi nevojë ” thotë Cahani. “Edhe pse ne jemi të vegjël ne mund të konkurrojmë drejtpërdrejtë me kompanitë e mëdha të kërkimit”. Ne kemi mundësi të shpenzojmë më pak kohë duke menduar për teknologji, dhe më shumë kohë duke u fokusuar në shërbimin e nevojave të përdoruesve shqipfolës të Internetit.

Të qenit i vogël ka pas ndikim po ashtu edhe në surpriza të papritura për Gjirafën.

“Fillimisht, ne kemi analizuar se çfarë kërkojnë më së shumti përdoruesit, dhe kemi zbuluar se shumica e tyre kërkojnë vetura të përdorura,” thotë Cahani. “Në bazë të kësaj ne i kemi agreguar të gjithë portalet që shesin vetura në Internet, i kemi kategorizuar fushat si modeli, kilometrat e kaluara dhe çmimi, dhe kemi vendosur të gjitha shënimet në Indeksin kërkimorë të Azure. Ne ishim në gjendje të ndërtojmë tërë indeksin në vetëm një javë, dhe ne tani kemi shërbimin më të mirë të kërkimit të veturave në shitje në rajon, me mbi 70,000 shpallje të veturave, të cilat mund të shpalosen çdo ditë.” Kompania ka ndërtuar indekse të ngjashme për vende të lira të punës dhe shpallje të patundshmërive, dhe është duke punuar ne indeksin e telefonave të mençur. Ai thotë “ do të na duheshin muaj të tërë për të ndërtuar indekse të tilla nëse do duhej të menaxhonim infrastrukturën tonë”

Zhvillim i shpejtë dhe efikas

Si kompani e vogël Gjirafa duhet t’i jep zhvilluesve të saj teknologji që përshpejton kohët e zhvillimit.

“ Për këtë arsye ne përdorim Microsoft Visual Studio Ultimate 2013 si platforme të përgjithshme zhvilluese, “ thotë Cahani.

“Ne po ashtu zhvillojmë në Android dhe iOS, por zhvillimi dhe kodimi në Visual Studio është pakrahasimisht më i lehtë. Kjo do të thotë se puna kryet më shpejtë, na kushton më pak dhe ndihmon të ofrojmë më shpejtë shërbime të reja për përdoruesit tanë. Visual Studio bën pjesë të madhe në rritjen dhe suksesin tonë.

Përderisa kompania vazhdon duke shtuar shërbime të reja në Gjirafa.com, ajo planifikon të zhvillojë zgjidhje të reja të bazuara në Azure.

“Ne jemi duke punuar në zgjidhje e-commerce si dhe zgjidhje për kërkime për klientë biznesorë ” thotë Cahani. Ne mendojmë se mund të përdorim Azure Search për t’i ofruar punëtorëve të organizatave të gjejnë me lehtësi informatat në organizatën e tyre. Çka do që planifikojmë të bëjmë, ne do të mbështetemi në përparësitë e shkathtësive të cilat i kemi zhvilluar në Azure dhe Visual Studio, dhe ne do të përdorim partneritetin me Microsoft që të rrisim kompaninë tonë në të ardhmen.”

Ky artikull është i përkthyer, artikulli origjinal mund të shikohet këtu. /ameble