tacrpy package

Subpackages

Submodules

tacrpy.data_operations module

Modul pro běžné transformace a zpracování dat.

tacrpy.data_operations.create_mapping_dict(df: DataFrame) dict[source]

Z dataframe, kde se k jedné hodnotě váže více pozorování v samostatných řádcích (např. projekt má N uchazečů) vytvoří mapovací dict

Parameters:

df – dataframe s hodnotami one-to-many

Returns:

mapovací dict, kde unikátní ID je klíč a hodnotou je seznam hodnot, které patří k danému unikátnímu ID

tacrpy.data_operations.list_intersection(list1: list, list2: list, percentages: bool = True) dict[source]

Získá průnik hodnot mezi dvěma seznamy (listy) a vypočítá metriky průniku.

Metriky průniku:

  • intersect (list) - seznam stejných hodnot

  • intersect_count (int) - počet stejných hodnot

  • intersect_ratio (float) - podíl stejných hodnot vůči všem unikátním hodnotám z obou seznamů

  • intersect_l1_ratio (float) - podíl stejných hodnot vůči všem hodnotám v prvnímu seznamu

  • intersect_l2_ratio (float) - podíl stejných hodnot vůči všem hodnotám v druhému seznamu

Parameters:
  • list1 – seznam hodnot

  • list2 – seznam hodnot

  • percentages – poměrové metriky zobrazí vrátí v procentech (0-100) s přesností na dvě desetinná místa

Returns:

dict metrik průniků

Module contents