Oktatott tágyak

Csillagászati adatbázisok

Neptun kódok: fffn9k24 FIZ/2/108E

Tárgyleírás: A félév során géptermi órák keretében megismerkedünk a legfontosabb optikai tartományban készült Sloan Digitális Égtérkép adatbázisával. Az interneten keresztül bárki számára elérhető adatbázis SQL nyelven programozható, így számos érdekes csillagászati probléma közvetlenül, az adatok letöltése nélkül is megoldható. Az SQL nyelvet ismert csillagászati eredmények reprodukálása során, négy projekt kidolgozása közben sajátítjuk el. A projektek vegyesen válogatnak a galaktikus- és extragalaktikus csillagászat, kozmológia és asztrostatisztika tárgyköréből. A kreditek megszerzésének feltétele a projektek önálló kidolgozása valamint jegyzőkönyv beadása. A tárgy egyaránt ajánlott csillagászatban járatos, illetve az adatbázisok iránt érdeklődő, más természettudományos képzésben részt vevő hallgatók számára. A szükséges minimális csillagászati ismeretek az órák során elsajátíthatók.

Oktatás célja: A kurzus célja a hallgatókat megismertetni az SQL nyelv alapjaival, illetve az SQL nyelv statisztikai lehetőségeivel nagy adatbázisok feldolgozásának céljára. A feladatok ugyan a csillagászat témaköréből merítenek, de az elsajátított ismeretek más tudományterületeken is hasznosíthatók.

Tantárgy tartalma: SQL adatbázisok rövid ismertetése, az SQL nyelv gyakorlati elsajátítása. A kidolgozandó feladatok például:

  • Fősorozat-illesztés nyílt halmazra
  • A Naprendszer keringési sebességének meghatározása
  • Galaxisok luminozitásfüggvényének meghatározása
  • Hubble-diagram készítése vörös óriásgalaxisok alapján.

Számonkérési és értékelési rendszer: A félév során projekteket kell kidolgozni, melyekről a hallgatók a félév során szóban beszámolnak, illetve a félév végén egy szabadon választott projektről részletesen kidolgozott jegyzőkönyvet nyújtanak be.

Irodalom:

  • Carroll & Oastlie „An Introduction to Modern Astrophysics” 2006 Pearson
  • Marik Miklós szerk. „Csillagászat” 1989 Akadémiai Kiadó
  • Stoughton et al. „Sloan Digital Sky Survey: Early Data Release” 2002 The Astronomical Journal
  • Szalay et al. „The SDSS skyserver: public access to the sloan digital sky server data” 2002 Proceedings of the 2002 ACM SIGMOD international conference on Management of data
  • Graham, Fitzpatrick & McGlynn eds, „The National Virtual Observatory: Tools and Techniques for Astronomical Research” ASP Conference Series, Vol. 382 

Csillag- és galaxispopulációk

Neptun kód: ff1n9k40

Tárgyleírás: A speciális előadás betekintést nyújt galaxisok, galaxispopulációk spektroszkópiai és statisztikai analízisének elméletébe, eredményeibe. Az előadás az alapoktól építkezve (megfigyelő spektroszkópiai, csillagok spektroszkópiája) jut el a galaxisok elméletének komplex modelljeiig (populációszintézis, aktív galaxisok, galaxisevolúció).

Tantárgy tartalma: Egy spektrográfiai és sztellárasztronómiai bevezető után megismerkedünk a galaxisspektrumok analízisének elméleti hátterével, az ún. populációszintézis-modellekkel. Röviden áttekintjük az intersztelláris gáz és por megfigyelhető hatásait, elméleti modellezhetőségüket. Megismerkedünk a galaxisok spektroszkópiai osztályozásával, külön kitérve a csillagontó és aktív magvú galaxisokra. Megtanuljuk, hogy hogyan kell meghatározni a különböző osztályok luminozitásfüggvényeit, valamint kitérünk a galaxisevolúció vizsgálatának lehetőségeire. Végezetül megismerkedünk a Virtuális Obszervatórium spektroszkópiai eszköztárával. Az előadások során szó lesz a spektrumok analíziséhez használt néhány alapvető matematikai módszerről is. A speciális előadás elsősorban csillagász MSc, illetve asztrofizika szakirányos fizikus MSc hallgatóknak ajánlott.

Számonkérési és értékelési rendszer: A félév végén az elméleti anyagból szóbeli vizsgát kell tenni.

Irodalom:

  • Carroll & Ostlie: An introduction to modern astrophysics

Adatbányászat a csillagászatban

Neptun kód: ff2n9k66

Tárgyleírás: A félév során géptermi órák keretében ismerkedünk meg a csillagászati adatmodellezés, haladó statisztika és adatbányászat néhány alapvető módszerével. A kidolgozandó projektek főként az extragalaktikus csillagászat és a kozmológiai tárgyköréből merítenek, azokat valódi megfigyelési adatok alapján dolgozzuk ki. A feladatok megoldásához tetszőleges adatfeldolgozó-rendszer használható (pl.: Python, Matlab, Octave, illetve IDL). A tárgykreditek megszerzésének feltétele a projektek kidolgozása, valamint jegyzőkönyv beadása. A tantárgy első sorban megfelelő előképzettséggel rendelkező csillagász, illetve fizikus hallgatók számára ajánlott.

Oktatás célja: A tantárgy célja, hogy megfelelő előképzettséggel rendelkező MSc vagy PhD képzésben résztvevő csillagász, illetve fizikus hallgatókat megismertessen a csillagászati adatmodellezés, adatfeldolgozás, asztrostatisztika és adatbányászat néhány alapvető gyakorlati módszerével.

Tantárgy tartalma: Luminozitásfüggvény meghatározása, függvényillesztés maximum likelihood módszerrel, bootstrapping és jack-knife-módszer, kozmológiai paraméterek meghatározása szupernóva-észlelések alapján Monte Carlo módszerrel, automatikus csillag-kvazár, ill. csillag-galaxis szeparáció, Support Vector Machine, fotometrikus vöröseltolódás-becslés, kNN, SVM, random forest módszerek.

Számonkérési és értékelési rendszere: A félév során projekteket kell kidolgozni, melyekről a hallgatók a félév során szóban beszámolnak, illetve a félév végén egy szabadon választott projektről részletesen kidolgozott jegyzőkönyvet nyújtanak be.

Irodalom:

  • Caroll & Ostlie: Introduction to Modern Astropyhsics
  • Press, Teukolsky, Vetterling & Flannery: Numerical Recipes
  • Ivezić, Connolly, VanderPlas & Gray: Statistics, Data Mining, and Machine Learning in Astronomy: A Practical Python Guide for the Analysis of Survey Data

Tudományos adatbázisok

Neptun kódok: fffn9k61 INFPHD436-K-6

Tárgyleírás: A tantárgy célja a természettudományok különböző területein felmerülő adattárház problémák ismertetése, illetve annak bemutatása, hogy ezek a problémák miként kezelhetőek relációs adatbázis-kezelők segítségével. A félév során a mesterszakos és doktori képzésben résztvevő hallgatók megismerkednek az adattárházak tervezésének hardveres és szoftveres szempontjaival, valamint gyakorlati szemléletű bevezetést kapnak az adatbázisok megvalósításának részleteibe és a lekérdezések optimalizálásába. Az előadások kitérnek a tudományos adatok kezelésének néhány speciális területére: nagy mennyiségű adat betöltésére, többdimenziós adatok kezelésére, a gömbi koordináták problémáira, valamint a gráf-adatbázisokra. Az előadások elsősorban a soralapú relációs adatbázisokra koncentrálnak, de érintik az oszlop- és tömbalapú, valamint noSQL megoldásokat is.

Oktatás célja: A tantárgy célja a természettudományok különböző területein felmerülő adattárház problémák ismertetése, illetve annak bemutatása, hogy ezek a problémák miként kezelhetőek relációs adatbázis-kezelők segítségével.

Tantárgy tartalma: • Tudományos adatbázisok alapvetése. A negyedik paradigma. Tudományos adatfeldolgozás az exponenciális korban, Amdahl-törvények, Jim Gray törvényei. • x64 alapú nagyteljesítményű szerver architektúrák. Többprocesszoros rendszerek. Gyorsítótárak, gyorsítótár-algoritmusok., snoop filter. • Adattároló rendszerek. A merevlemezek ismertetése. Hardver adatátviteli protokollok. RAID rendszerek, RAID konfigurációk. RAID karbantartási műveletek, tipikus RAID problémák. RAID szoftveres és hardveres megvalósítása. • A RAID 5 konfiguráció tulajdonságai. Paritásbitek, RAID 5 írása, a késleltetés növekedése. Az írási lyuk. • Az IO rendszer rétegei. Partíció, kötet, fájlrendszer, fájl API. Redundáns kötetek. Bufferelt és nem bufferelt IO. Szinkron/aszinkron függvények, függő műveletek. Az IO teljesítmény mérése. Hálózatok. • Relációs adatbázis-kezelők. A relációs adatmodell. Tábla, elsődleges kulcs, idegen kulcs. Adattárolás sor alapú relációs adatbázisokban. Lap, heap tábla, klaszterezett index, másodlagos index. Fájl csoportok, particionált táblák. • Indexek tulajdonságai. B-fák, a klaszterezett index és másodlagos index különbözősége. Az index kitöltési faktor, index statisztika. Indexek optimalizálása. • Query végrehajtás SQL adatbázisokban. A végrehajtás lépései. Alapvető fizikai operátorok. • JOIN műveletek. A JOIN műveletek típusai, különböző fizikai JOIN operátorok. • Agregált függvények. Agregált függvények implementálása. Az agregálás fizikai megvalósítása. GROUP BY műveletek. • Lekérdezések optimalizálása. Az alapprobléma bemutatása. Az optimalizálás szempontjai, a rendelkezésre álló információk, a megfelelő index kiválasztása. • Tranzakciók. A tranzakciók alapvető tulajdonságai. Izolációs szintek. Fantom olvasás és elkerülése. A zárolás, holtpont és elkerülése. Tranzakciók lehetséges kimenetelei. A tranzakciós napló. • Biztonsági mentés. A tranzakciós napló, visszaállítási modellek. Replikációs módszerek. • Adatbetöltés. Tudományos adatok problémái. A többlépéses adatbetöltés tipikus lépései, a módszer előnye. BULK INSERT és egyszerű INSERT összehasonlítása. Adatok konzisztenciájának ellenőrzése. • Tudományos adatbázisok metaadatai. Ontológiák, tartalomazonosítók. Provenance, adatminőség. Tudományos adattárházak összekapcsolása. • Térbeli adatok indexelése. Alapvető térbeli struktúrák. Térbejárási módszerek. Adatok kondicionálása indexeléshez. • Térbeli indexek alapvető alkalmazásai. • A gömbfelszín indexelésének módszerei. • Különböző adatmodellek leképezése a relációs adatmodellre: fastruktúrák, gráfok. Nem strukturált adatok tárolása. • Oszlopalapú adatbázisok. A tárolási modell. JOIN indexek. Kurzorok. Címfolytonos adattárolás, vektorizált műveletek, JIT fordítás szerepe. • Tömbadatbázisok. Az adattárolási modell. Tömbök feldolgozásának alapproblémái. Kernel függvények. Címfolytonos adattárolás, műveletek vektorizálása, JIT fordítás szerepe. • Elosztott adatbázisok. Az alapvető lehetőségek és problémák bemutatása. Particionálási lehetőségek. A replikáció és konzisztencia kérdése. Alapvető fizikai operátorok megvalósítása. Az elosztott JOIN megvalósításának alapötletei. • A Hadoop-MapReduce rendszer elvi bemutatása. Programok írása a MapReduce modellben. • noSQL adatbázisok. Egyszerűsítések a relációs adatbázisokhoz képest. CAP-tétel. A tranzakciós modell egyszerűsítése. A konzisztencia-modell fellazítása, konfliktusok feloldása.

Számonkérési és értékelési rendszer: A speciális előadás tananyagából a félév végén szóbeli vizsgát kell tenni.

Irodalom:

A fizika numerikus módszerei II.

Neptun kódok: mf1c1m04 mf1c2m04 mf1n1m04

Tárgyleírás: Az előadás, a fizikus tantervi hálóban korábban szereplő alapozó informatikai jellegű előadások anyagára alapozva, betekintést nyújt a numerikus algoritmusok megvalósításának és alkalmazásának elméletébe. Az előadások tartalmához szorosan kapcsolódó gyakorlatokon a hallgatók házi feladatok kidolgozásán keresztül, önálló órai és otthoni munka keretében a gyakorlatban is megismerkednek néhány alapvető numerikus algoritmus implementálásával. A házi feladatok elkészítése C nyelven történik, mely ismerete a tantárgy elvégzésének előfeltétele.

Oktatás célja: Az oktatás célja, hogy a hallgatók elméleti alapot és gyakorlati tapasztalatot szerezzenek alapvető numerikus algoritmusok megvalósításában és alkalmazásában. A gyakorlatok elsősorban az önálló programozói munkára koncentrálnak.

Tantárgy tartalma: Lineáris egyenletrendszerek megoldása, mátrix inverz és determináns kiszámolásának algoritmusai. Adatmodellezés, függvényillesztés. Fizikai törvények, mérések, modellek. A maximum likelihood elv. Az általános legkisebb négyzetek módszere. Numerikus integrálás. Newton-típusú formulák, Gauss-formulák. Monte-Carlo módszer. Véletlen számok generálása. Függvények közelítése, interpoláció egy és többdimenzióban. Nemlineáris egyenletrendszerek megoldása numerikusan. Polinomok gyökeinek meghatározása. Sajátértékfeladatok megoldásának numerikus módszerei. Optimalizáció, függvények szélsőértékeinek megkeresése. Szimulált hőkezelés, evolúciós algoritmusok.

Számonkérési és értékelési rendszer: A gyakorlati jegy a kidolgozott házi feladatokra kapott pontszám és egy írásbeli elméleti teszt eredményének kombinációjából áll össze. Az aláírás feltétele a gyakorlati jegy megszerzése.

Irodalom:

  •  W.H. Press et al.: Numerical Recipes, Cambridge University Press, 1992.
  • The GNU Scientific Library: http://www.gnu.org/software/gsl/

Digitális méréstechnika laboratórium

Neptun kód: ff1n4f03

Extragalaktikus asztrofizika II. / Az Univerzum nagyskálás szerkezete

Neptun kód: ff2n1a01