Informatikus témakiírások

BSc szakdolgozati témák

SQL adatbázis-séma indexelő és kereső szolgáltatás fejlesztése c#-ban

A nagy tudományos adattárházak akár több száz adatbázis-szerverből is állhatnak, melyek menedzselése nagy kihívást jelent. Az adatbázisokkal dolgozó kutatók nagy számban hozhatnak létre saját adatbázisokat, azokon belül táblákat és egyéb objektumokat. A szakdolgozó hallgató feladata egy olyan szoftver specifikálása, implementálása, tesztelése, dokumentálása és demonstrálása, mely automatikusan felderíti a hálózaton elérhető adatbázis-szervereket, analizálja az adatbázis-sémákat és ezekről egy központi indexet készít, melyet folyamatosan frissít. A szoftver legyen képes beépülő modulok kezelésére, hogy több adatbázis-platform indexelése is biztosított legyen. Az index kereséséhez álljon rendelkezésre egy .Net API, REST interfészek, valamint egy weboldal. A feladat elvégzéséhez szükséges alapismeretek: .Net, c#, SQL.

SQL interpreter készítése az Astronomical Data Query Language-hez

Csillagászati adatbázisok kezelésére, statisztikai analízisére kiválóan alkalmas az SQL nyelv, ám mégis rendelkezik néhány olyan limitációval, ami indokolttá tette egy kifejezetten csillagászati célra készült lekérdezőnyelv megalkotását. Az SQL-t kiegészítő funkciót első sorban gömbi geometriai, régió alapú keresésekre fókuszálnak. A keresések elvileg megvalósíthatók lennének GIS rendszerek segítségével, ám ezek számos csillagászatban fontos problémát (pl. az ún. spatial joint) nem támogatják. A szakdolgozó hallgató feladata, hogy egy olyan interpreter specifikálása, megvalósítása, tesztelése, dokumentálása és demonstrálása, mely az ADQL lekérdezesek SQL lekérdezésekké (vagy azok sorozatává) alakításával, valamint a Hierarchical Triangular Mesh gömbi indexelési módszer felhasználásával megoldja az eredeti problémát. A feladat elvégzéséhez szükséges ismeretek: .Net, C#, SQL.

Gömbi alakzatok 3-dimenziós és vetületi vizualizációja HTML5-tel

A csillagászati adatbázisok szisztematikusan elkészített égtérképek (az égről készült CCD felvételek) adataiból készülnek. A különböző távcsöves megfigyelések az égbolt más és már területéről készülnek, így a lefedettségi térképek pontos ismerete elengedhetetlen a csillagászok számára. Ebből a célból több programkönyvtár is rendelkezésre áll, melyek különböző reprezentációkban képesek gömbi alakzatok kezelésére. A szakdolgozó hallgató feladata, hogy egy létező gömbi programkönyvtár, egy égbolt-lefedettségi adatbázis, valamint szerver oldali REST interfészek és kliens oldali javascript és HTML5 segítségével olyan vizualizációs eszközt készítsen, mely alkalmas a gyakran bonyolult alakzatok különböző projekciókban való megjelenítésére. A feladat elvégzéséhez szükséges ismeretek: HTML5, javascript, REST, illetve a szerver-oldali modulokhoz .Net, C# és SQL ajánlott.

Párhuzamos, aszinkron IO API fejlesztése .Net-hez

A nagyobb teljesítmény és sávszélesség érdekében adat-intenzív alkalmazásokban finomhangolt diszkrendszereket használunk. A hardveres RAID illetve JBOD megoldások azonban kihívás elé állítják az átlag programozót, hiszen a megfelelő IO teljesítmény eléréséhez fel kell adni a hagyományos, szinkron programozási modelleket. A szakdolgozó hallgató feladata egy olyan fájlkezelő API specifikálása, implementálása, tesztelése, dokumentálása és demonstrálása, mely elrejti az aszinkron fájlkezelés komplexitását a programozó elől, ugyanakkor maximális IO teljesítményt nyújt párhuzamosított lemezkezelés által. A feladat elvégzéséhez szükséges alapismeretek: .Net, c#, párhuzamos programozás.

Az UDT protokolt implementáló programkönyvtár készítése .Net-hez

A UDP-based Data Transfer Protocol (UDT) egy nagyteljesítményű hálózati adatátviteli protokoll, mely kifejezetten nagykapacitású, nagy távolságokat átfogó hálózatokhoz lett kifejlesztve. Előnye, a TCP-vel szemben, hogy nagyméretű pufferek és intelligens torlódás-elhárítási algoritmusok alkalmazásával elkerüli a nagy hálózati késleltetésből, illetve túlterhelt hálózatból adódó problémákat, miközben megbízható átviteli folyamot biztosít. A szakdolgozó hallgató feladata, hogy az UDT protokoll specifikációi alapján egy .Net kompatibilis implementációt készítsen, és azt sebességtesztekkel, egy grafikus felülettel működő mérőprogrammal demonstrálja. Végezze el a méréseket memória-memória és memória-diszk átvitel esetében is. A feladat elvégzéséhez szükséges ismeretek: .Net, C#, aszinkron és párhuzamos programozás.

PhD témák

Elosztott tudományos adatbázisok federálása

A modern természettudományos adatbázisok napjainkra elérték a 10-100 TB-os mérettartományt, és néhány éven belül a petabájt számít majd átlagosnak. Ilyen adatmennyiség kezelésére, feldolgozására célszerű relációs adatbázisokat használni, ám a relációs adatbázis-kezelők egyik hiányossága, hogy csak kis mértékben támogatják több szerver összekapcsolását, elosztott lekérdezések futtatását. Számos tudományterület igényli ugyanakkor, hogy akár helyi hálózaton elérhető, akár egymástól igen távol levő, csak Interneten összekapcsolt adattárházak adatainak egyesítésével oldjunk meg különböző feladatokat. A téma iránt érdeklődő kutató informatikus feladata, hogy feldolgozza az elosztott relációs adatbázisok elméletének irodalmát, majd erre támaszkodva olyan elosztott technológiákat dolgozzon ki, melyek lehetővé teszik geográfiailag is elosztott (elsősorban csillagászati) adattárházak összekapcsolását.

előírt nyelvtudás: angol
további elvárások: Magas szintű programozói ismeretek (C#), SQL technológiák (MSSQL)

http://www.doktori.hu/index.php?menuid=195&tk_ID=93437