Training Day

A november 25-én, kedden megrendezésre kerülő Training Day olyan workshopokat kínál, amelyek lehetőséget biztosítanak az elmélyülésre egy-egy témában. Egy workshop fél napot vesz igénybe, így a nap folyamán akár két különböző terület megismerésére is van mód.

Miért érdemes részt venni?

  • A workshopok félnapos terjedelme lehetőséget nyújt az egyes témák alaposabb megismerésére
  • A workshopok előadói az adott terület nagy tapasztalattal rendelkező szakértői, így a legjobbaktól lehet tanulni
  • A kiscsoportos lebonyolítási forma gyors haladást biztosít

 

Workshopok időbeosztása

Az alábbi táblázatban a workshopok időbeli beosztása található.  A délelőtti három workshop párhuzamosan zajlik 9 és 12 óra között, a délutániak pedig 13 és 16 óra között kerülnek megrendezésre, szintén párhuzamosan.

Workshopok

November 25., kedd

8:30-9:00 Regisztráció/Registration

BI trendek – Arató Bence, BI Consulting

Introduction to R – Daróczi Gergely, Rapporter

Data Analysis in Python – Gulyás Máté, Dmlab

12:00-13:00 Ebédszünet/Lunch

Minőségbiztosítás az adatelemzésben – Kovács Gyula, Andego

Fast and flexible data wrangling with data.table – Matt Dowle

Introduction to machine learning using Python and scikit-learn – Gaël Varoquaux, INRIA

16:00 Program vége/Close

 

Workshopok tartalma

  • BI trendek workshop
    Hol tart ma a BI, és mit várhatunk a holnaptól? Milyen technológiai és alkalmazási trendek figyelhetők meg külföldön, és mi jut el hozzánk? Milyen irányba mutatnak a legújabb fejlesztések és mik lesznek a top témák az elkövetkező időszakban? Mik voltak a tavalyi év legfontosabb eseményei, és milyen újdonságok várhatóak 2015-ban?
    Arató Bence, BI Consulting
  • Minőségbiztosítás az adatelemzésben
    Az adatbányászati és elemzési feladatok során több tucatnyi különböző hibát lehet elkövetni. A workshop a leggyakoribb hibaforrásokat és azok kezelését mutatja be. A workshopon való részvétel alap sql tudást feltételez.
     
    Kovács Gyula, Andego
  • Introduction to R
    Open-source R was referred to as the lingua franca of data analysis by the New York Times in 2009, and it indeed started to dominate the toolbox of data scientists both in the academic and business sector. This workshop will give an overview on the R ecosystem and the most commonly used tasks, like installing R, RStudio and R packages, loading data from various sources and applying some of the data mining methods. No prior programming skills are required.
    Daróczi Gergely, Rapporter.net

    Prerequisites: Bring your own laptop with the following programs installed on it:  R and RStudio. Please make sure to install these programs prior to the beginning of the workshop.

  • Fast and flexible data wrangling with data.table
    This tutorial aims to guide complete beginners in data.table from basic queries through to advanced topics. Familiarity with base R is an advantage but not required. The package provides an enhanced version of data.frame including fast aggregation of large datasets, fast ordered joins, fast add/modify/delete of columns by group using no copies at all, list columns and a fast file reader: fread(). Although the speed benefits are greatest on large datasets (1GB – 100GB) many also use it on small datasets for its brief and flexible syntax. Potential attendees will recognise these features as helpful to them.
    Matt Dowle, author of the  Data.table R csomag package

    Prerequisites: Bring your own laptop with the following programs installed on it:  R and RStudio. Please make sure to install these programs prior to the beginning of the workshop.

  • Data Analysis in Python
    Python has become one of the top emerging data analytics trends. Due to its flexibility and wide variety of tools, it is very popular among data scientists. This workshop serves as an introduction to Python, the tools we use and the libraries that help us working with data. We learn the basics of Python with the core features that makes it the right setup for exploratory data analysis, data processing or production grade data driven applications. We also get a grasp of the toolbox provided by the Python community and we will talk about the libraries that can be used to crunch and explore data and build models based on the results.
    Gulyás Máté, Dmlab

    Prerequisites: Bring your own laptop with the following programs installed on it: Python 2.7IPython.

  • Introduction to machine learning using Python and scikit-learn
    The purpose of this workshop is to get a first hands on experience in building predictive models using the PyData stack. Scikit-learn is a versatile Machine Learning library for Python that blends well with the NumPy and SciPy ecosystem and is used by a growing user-base of both academic researchers and data scientists and engineers in the tech industry.
    Gaël Varoquaux, INRIA

    Prerequisites: Bring you own laptop with the following programs installed on it: Python 2.7, and IPython. Basic Python knowledge required.

     

     

     

A tervezett workshopok csak kellő jelentkezői létszám esetén indulnak el.