Python pandas statistika
python.py
ceesveSors = pandas.read_csv ( "datotetka.csv" , encoding = "utf8" , decimal = "," , delimiter = ";" , header = 0 )
print ( ceesveSors ['Stupac'].value_counts().idxmax() ) # Najčešći podatak
print ( ceesveSors ['Stupac'].mode() ) # Najčešći podatak, drugi način
print ( ceesveSors['Stupac'].value_counts().head(10) ) # Prvih 10 najčešćih, s brojem pojavljivanja
pandas.options.display.max_rows = None # Prikaži sve redove, izbjegni "..." tri točke
print ( ceesveSors ['Stupac'].value_counts() ) # Prikaži sve, po čestosti
print ( ceesveSors['Stupac'].nlargest(n=10)) # Najvećih 10
print ( ceesveSors.nlargest(n=5, columns=['Stupac']) ) # Najvećih 5 stupca "Stupac"
print ( ceesveSors['Stupac'].value_counts().index.tolist()[:10] ) # Prvih 10 - broj pojavljivanja
print ( ceesveSors['Stupac'].value_counts().values.tolist()[:10] ) # Prvih 10 - vrijednosti
print ( ceesveSors.loc [ ( ceesveSors ["Stupac1"] == "Naziv") & (ceesveSors.Stupac2.str.contains("neštodrugo")) ] ) # jedno AND drugo, drugo sadrži X
pandas xpandas loc xloc filter xfilter search xsearch and xand contains xcontains