tacrpy package
Subpackages
- tacrpy.analytics package
- tacrpy.data_fetcher package
- tacrpy.datahub package
- tacrpy.nlp package
Submodules
tacrpy.data_operations module
Modul pro běžné transformace a zpracování dat.
- tacrpy.data_operations.create_mapping_dict(df: DataFrame) dict[source]
Z dataframe, kde se k jedné hodnotě váže více pozorování v samostatných řádcích (např. projekt má N uchazečů) vytvoří mapovací dict
- Parameters:
df – dataframe s hodnotami one-to-many
- Returns:
mapovací dict, kde unikátní ID je klíč a hodnotou je seznam hodnot, které patří k danému unikátnímu ID
- tacrpy.data_operations.list_intersection(list1: list, list2: list, percentages: bool = True) dict[source]
Získá průnik hodnot mezi dvěma seznamy (listy) a vypočítá metriky průniku.
Metriky průniku:
intersect (list) - seznam stejných hodnot
intersect_count (int) - počet stejných hodnot
intersect_ratio (float) - podíl stejných hodnot vůči všem unikátním hodnotám z obou seznamů
intersect_l1_ratio (float) - podíl stejných hodnot vůči všem hodnotám v prvnímu seznamu
intersect_l2_ratio (float) - podíl stejných hodnot vůči všem hodnotám v druhému seznamu
- Parameters:
list1 – seznam hodnot
list2 – seznam hodnot
percentages – poměrové metriky zobrazí vrátí v procentech (0-100) s přesností na dvě desetinná místa
- Returns:
dict metrik průniků