Welcome to tacrpy documentation!

Tacrpy knihovna slouží k práci s daty a vypracování analýz TA ČR. Umožňuje:

  • načítat data ze ze “zdroje pravdy” a otevřených dat IS VaVaI (modul data_fetcher)

  • předzpracování, příprava a nahrání dat do DataHub (subpackage datahub)

  • zpracování textových dat (subpackage nlp)

Getting started

Instalace knihovny

pip install tacrpy

Načítání dat ze “zdroje pravdy” můžeme pouze v Google Colab prostředí, proto nejdřív potřebujeme získat autentizační údaje

# kód k získání authentizačních údajů, k připojení se souborů na Google disku

from google.colab import auth
auth.authenticate_user()

import gspread
from google.auth import default
creds, _ = default()

Načtení a práce s daty v Google Colab prostředí

from tacrpy import data_fetcher

proj = data_fetcher.Projects(creds)

# získání agregovaných údajů na úrovni veřejných soutěží
summary_df = proj.summary

# získání agregovaných údajů na úrovni programů
summary_df = proj.create_summary(level='prog')

# filtrování podle programů
proj_prog_filter = proj.select_programme('FW', 'CK').projects

# filtrování podle veřejných soutěží
proj_cfp_filter = proj.select_cfp('TA01', 'TK01', 'CK01').projects

# filtrování podpořených projektů
proj_funded = proj.select_funded().projects

# řetězení jednotlivých filtrů
proj_filter = proj.select_programme('FW','CK').select_funded().projects

Indices and tables