代入する値 ・スカラー:どの行にも共通した値を代入 ・リスト:行ごとに値が異なる場合 ・Series:ほかの列データから値を加工して代入 [Take0] テスト用のDFを作成する 【書式】 【コード】 # 列数が4で、行数が3のdfを作る import pandas as pd list1=[…
[Take1] 先頭5行の表示 【書式】 df.head(n) オプション n 先頭から何行目まで表示するか?(省略した場合5行) 【コード】 import pandas as pd df=pd.read_excel("/content/drive/MyDrive/Python_2024/002/iris-l.xlsx",index_col=None,usecols=["sepal_le…
[Take1] 特定の列を取り出す 【書式】 列を取り出す df["列名"] 【コード】 import pandas as pd # テストデータの読み込み df = pd.read_csv("/content/drive/MyDrive/Python_2024/004/test5.csv",encoding="shift_jis") # 名前を取り出す df2=df["名前"] #…
[Take1] CSVデータをdfオブジェクトとして読み込む 【書式】 pandas.read_csv('データ名.csv',encoding='もジコード',index_col='インデックス列名',usecols=['列名1','列名2','列名3'],dtypes={"対象列名":"データ型"}) オプション encoding 文字コード ind…
[Take1] まずは要約統計量を計算する 【書式】 df.describe() 戻り値として出てくる統計量 【コード】 import pandas as pd # テストデータの読み込み df = pd.read_csv("/content/drive/MyDrive/Python_2024/004/test6.csv",encoding="shift_jis") # 要約統…
[Take1] いろいろな集約方法 【書式】 単一列による集約 df.groupby("列名") 【コード】 import pandas as pd # テストデータの読み込み df = pd.read_csv("/content/drive/MyDrive/Python_2024/004/test6.csv",encoding="shift_jis") # 「学年」列で集約し…
[Take1] 数値の大小関係で絞り込む 【書式】 df[df["対象列名"] >= 50] 【コード】 import pandas as pd # テストデータの読み込み df = pd.read_csv("/content/drive/MyDrive/Python_2024/004/test5.csv",encoding="shift_jis",index_col='名前') # 数学が9…
[Take1] データの基本量を確認 【書式】 データの大きさを確認 df.shape データの行数を確認 len(df) データの要素数を確認 df.size データの列名を取得 df.columns 【コード】 import pandas as pd # テストデータの読み込み df = pd.read_csv("/content/dr…
[Take1] とりあえず読み込んでみる requests というライブラリを使用する 【書式】 response=requests.get(url) 戻り値のデータ型 requests.models.Response 【コード】 import requests url="https://20200105.hatenadiary.jp/entry/2024/04/30/152528" res…
【書式】 今回は、[requests]といライブラリを使う。 既存環境にどうライブラリがインストールされているか確認 【コード】 py -m pip list 【結果】 Package Version contourpy 1.2.1 cycler 0.12.1 fonttools 4.51.0 joblib 1.3.2 kiwisolver 1.4.5 matplo…
テキストを強調表示する場合は 「*文字列*」 のように「*」 で囲う。斜体表示する場合は 「**String**」 のように 「**」 で囲う(アルファベットのみ)。
[Take0] seaborライブラリに入っているアヤメのデータを読み込む 【書式】 【コード】 import pandas as pd import seaborn as sns sns.set() df=sns.load_dataset("iris") print("先頭5データ",df.head()) print("\n") print(df.info()) 【結果】 import pa…
[Take0] テスト用データの読み込み 【書式】 【コード】 import pandas as pd df=pd.read_csv("/content/drive/MyDrive/Python_2024/002/test3.csv",encoding="Shift-JIS",index_col=0) print(df) 【結果】 理科 国語 数学 94 80 100 90 88 85 95 70 90 90 6…
[Take1] 所定IQが上から何%か調べる IQ:平均100,標準偏差15の正規分布のこと→ざっくり、80から120の間にないと悲しい気分になるということ。 【書式】 【コード】 from scipy.stats import norm scorelist=[60,70,80] for score in scorelist: cdf=norm.c…
[Take1] 偏差値60,70,80が上から何%になるか? 偏差値:平均50,標準偏差10の正規分布のこと 【書式】 cdfはCumulative Distribution Functionの頭文字 norm.cdf(対象値, loc=平均, scale=標準偏差) 【コード】 from scipy.stats import norm scorelist=[…
[Take0] 練習用データの定義とプロット 【書式】 ライブラリ:pandas,matplotlib,seaborn 書式 sns.distplot(df["列名"],fit=norm,fit_kws={"color":"色"}) plt.show() 【コード】 %matplotlib inline import matplotlib.pyplot as plt import japanize_matp…
[Take1] galton boardというおもちゃがあるらしい。 要は、パチンコの玉を台の真ん中に投入したら、どの辺に落ちるのか? ということを、球数と釘の段数を変数にして集計する。 で、釘にいかさまが無ければ落ちていく場所はきれいな正規分布になるんじゃない…
[Take0] サンプルデータの作成 平均値は同じだが、分布の異なる2系列のデータを定義する 【書式】 書式:ディクショナリ型データの作成 data={ "項目名1": [値1], "項目名2": [値2], "項目名3":[値3] } 【コード】 import pandas as pd data={ "ID": [0,1,2,…
[Take0] サンプルデータフレームの作成 【書式】 書式:散布図の凡例記述 plt.scatter([横軸],[縦軸], label="凡例") plt.legend() 【コード】 import pandas as pd import matplotlib.pyplot as plt import japanize_matplotlib data={ "A": [10,100,10,100…
japanize_matplotlibとは、グラフで日本語が使えるようになるライブラリ 【書式】 !pip install japanize_matplotlib 【結果】 Requirement already satisfied: japanize_matplotlib in /usr/local/lib/python3.10/dist-packages (1.1.3) Requirement alread…
[Take0] サンプル計算用のデータフレームを作成する 【書式】 【コード】 import pandas as pd data={ "A": [10,11,8,15,18,500] } dfA=pd.DataFrame(data) print("オリジナルのデータ") print(dfA) 【結果】 オリジナルのデータ A 0 10 1 11 2 8 3 15 4 18 …
[Take1] データフレームから平均値を算出する 【書式】 df["列名"].mean() 【コード】 import pandas as pd dfA=pd.read_csv("/content/drive/MyDrive/Python_2024/002/test.csv",encoding="Shift-JIS",index_col=0) print("元データ") print(dfA) # 平均値…
[Take0] ベースとなるデータフレームの作成 【書式】 【コード】 import pandas as pd data={ "A": [100,200,300], "B": [400,500,600], "C":[400,500,600], "D": [700,800,900], "E": ["1,000","1,100","1,200"] } dfA=pd.DataFrame(data) print(dfA) print…
[Take0] サンプルデータの作成 【書式】 【コード】 import pandas as pd data=[ [1,2,3], [4,5,6], [4,5,6], [7,8,9], [10,11,12] ] dfA=pd.DataFrame(data) # 結果表示 print(dfA) 【結果】 0 1 2 0 1 2 3 1 4 5 6 2 4 5 6 3 7 8 9 4 10 11 12 見辛いが、1…
[Take0] テスト用のデータフレームを作成する 【書式】 None は欠損値を意味する 【コード】 import pandas as pd data={ "国語":[1,2,None,4], "数学":[5,None,None,8] } idx=["一郎","二郎","三郎","四郎"] dfA=pd.DataFrame(data,index=idx) print(dfA) …
[Take0] 空のデータフレームに、別データフレームの特定列データを追加する 【書式】 空データフレームの作成 : df=pd.DataFrame() 列データの追加 : df["列名"]=列データ 【コード】 import pandas as pd dfA=pd.read_csv("/content/drive/MyDrive/Python…
[Take0] 最初の5行を表示する 【書式】 df.head() 【コード】 import pandas as pd df=pd.read_csv("/content/drive/MyDrive/Python_2024/002/test.csv",encoding="Shift-JIS",index_col=0) df.head() 【結果】 [Take1] 列名を表示する 【書式】 df.columns …
[Take0] CSVファイルを読み込む 【書式】 df=pd.read_csv("ファイル名",encoding="Shift-JIS") ※CSVファイルの文字コードが utf-8 ならばオプション不要 【コード】 import pandas as pd df=pd.read_csv("/content/drive/MyDrive/Python_2024/002/test.csv",…
[TAKE0] 行データからデータフレームを作る 【書式】 data=[[1行目データ],[2行目データ],[3行目データ]] df=pd.DataFrame(data) 【コード】 import pandas as pd data=[ [1,2,3], [4,5,6], [7,8,9] ] df=pd.DataFrame(data) print(df) # 以下、参考 print("…
[Take0] 画像を配列に加工する 予測するためには、対象となる画像を教師データのフォーマットに合わせる必要がある模様。 【書式】 PIL.Image.open.convert("L") PIL.Image.open.resize((8,8),PIL.Image.Resampling.LANCZOS) numpy.asarray(grayImage88,dtyp…