Python pandas statistika

python.py

ceesveSors = pandas.read_csv ( "datotetka.csv" , encoding = "utf8" , decimal = "," , delimiter = ";" , header = 0 )
print ( ceesveSors ['Stupac'].value_counts().idxmax() )            # Najčešći podatak
print ( ceesveSors ['Stupac'].mode() )                             # Najčešći podatak, drugi način
print ( ceesveSors['Stupac'].value_counts().head(10) )             # Prvih 10 najčešćih, s brojem pojavljivanja
pandas.options.display.max_rows = None                             # Prikaži sve redove, izbjegni "..." tri točke
print ( ceesveSors ['Stupac'].value_counts() )                     # Prikaži sve, po čestosti
print ( ceesveSors['Stupac'].nlargest(n=10))                       # Najvećih 10
print ( ceesveSors.nlargest(n=5, columns=['Stupac']) )             # Najvećih 5 stupca "Stupac"
print ( ceesveSors['Stupac'].value_counts().index.tolist()[:10] )  # Prvih 10 - broj pojavljivanja
print ( ceesveSors['Stupac'].value_counts().values.tolist()[:10] ) # Prvih 10 - vrijednosti
print ( ceesveSors.loc [ ( ceesveSors ["Stupac1"] == "Naziv") & (ceesveSors.Stupac2.str.contains("neštodrugo")) ] )     # jedno AND drugo, drugo sadrži X
pandas xpandas loc xloc filter xfilter search xsearch and xand contains xcontains