WSL2上のUbuntu 20.04上に分析環境を構築する

前提条件 項目 内容 使用ディストリビューション Ubuntu 20.04 LTS Python 環境 Anaconda PC 環境 SLAT 等必要なハードウェアが揃っていること 更新履歴 日付 内容 2021/08/18 Pyenvの仕様変更に追随 https://github.com/lewagon/dotfiles/pull/90 WSL 2環境を準備 Windowsの機能の有効化を行う: Linux用Windowsサブシステムと仮想マシンプラットフォームを有効化 コントロールパネルのWindowsの機能の有効化または無効化から行う Microsoft StoreからUbuntu 20.04LTSをインストール WSL 2にバージョンを変更 WSLの一覧は以下のコマンドで確認できる。 wsl -l -v このコマンドの結果は例えば以下のようになる。 NAME STATE VERSION * Ubuntu-18.04 Stopped 1 docker-desktop Stopped 2 Ubuntu-20.04 Running 2 docker-desktop-data Stopped 2 Ubuntu 20.04をWSL 2にするには以下のようなコマンドを実行する。 wsl --set-version Ubuntu-20.04 2 AnacondaでJupyter環境を構築する Python環境の構築はデータサイエンティストを目指す人のpython環境構築 2016を参考にして、一部のステップをアップデートしています。 アップデートの内容としては、参考記事では旧版のAnacondaがベースとなっているため、サーチパスを変更した結果、pyenvとAnacondaが一部競合を起こしていますが、これは現在のAnacondaでは解決している問題なので、変更を反映しています。また、それに伴い、bashの設定の変更をするためのステップを追加しています。 pyenvをインストールする git clone https://github.com/yyuu/pyenv.git ~/.pyenv echo 'export PYENV_ROOT="$HOME/.pyenv"' >> ~/.bashrc echo 'export PATH="$PYENV_ROOT/bin:$PATH"' >> ~/.bashrc echo 'eval "$(pyenv init --path)"' >> ~/.echo 'eval "$(pyenv init -)"' >> ~/.bashrc echo 'eval "$(pyenv init -)"' >> ~/.bashrc source ~/.bashrc Anacondaをインストールする pyenv install -l | grep ana # 最新版を確認する pyenv install anaconda3-yyyy.MM # 先のステップで確認した最新版にする pyenv rehash pyenv global anaconda3-yyyy.MM conda update conda conda init bash source ~/.bashrc dotnet coreをインストールする (オプション) wget -nv https://packages.microsoft.com/config/ubuntu/20.04/packages-microsoft-prod.deb sudo dpkg -i packages-microsoft-prod.deb sudo add-apt-repository universe sudo apt update sudo apt install apt-transport-https -y sudo apt install dotnet-sdk-5.0 -y # 現状の最新版の5をインストールする venv環境を用意する (オプション) 現在、Pythonのパッケージはconda、pipとなっており、どれを使えるかは状況次第です。ただ、幾つかのパッケージはpip環境しかないこともあり、venv環境もあると便利です。condaとpipの混用は危険であり避けるべきです。 ...

4月 2, 2021 · 1 分 · 169 文字 · Me

Prophetでcovid-19の入院治療を要する人数を予測する

Prophetを使用したサンプルとして、厚生労働省のオープンデータを使用して、入院治療等を要する人数を予測してみました。 %matplotlib inline import urllib import numpy as np import pandas as pd import matplotlib.pyplot as plt from fbprophet import Prophet cases_total_req = urllib.request.urlopen('https://www.mhlw.go.jp/content/cases_total.csv') cases_total_df = pd.read_csv(cases_total_req) cases_total_df['ds'] = pd.to_datetime(cases_total_df['日付']).dt.date cases_total_df['y'] = cases_total_df['入院治療を要する者'] cases_total_df['y'].plot() <matplotlib.axes._subplots.AxesSubplot at 0x1648a3d9c88> model = Prophet() model.fit(cases_total_df) INFO:fbprophet:Disabling yearly seasonality. Run prophet with yearly_seasonality=True to override this. INFO:fbprophet:Disabling daily seasonality. Run prophet with daily_seasonality=True to override this. <fbprophet.forecaster.Prophet at 0x1648a8297c8> future = model.make_future_dataframe(periods=365) forecast = model.predict(future) model.plot(forecast)

7月 10, 2020 · 1 分 · 71 文字 · Me

Ubuntu 20.04 Analytics Environment

Ubuntu 20.04 Analytics Environment 先日、リリースされた、Ubuntu 20.04をベースにWSL上で分析環境を作ってみました。 Microsoft StoreからUbuntu 20.04LTSをインストール Microsoft Storeからインストール後にとりあえず、一旦起動してインストールを完了 ユーザを作成する Windows Terminalのsettings.jsonを編集して、Windows Terminalに追加 Ubuntuを最新化する sudo apt update && sudo apt upgrade Jupyer環境をWSL上に構築する 2020の手順でJupyter環境を構築 Microsoft Repository keyを取ってくる wget https://packages.microsoft.com/config/ubuntu/20.04/packages-microsoft-prod.deb -O packages-microsoft-prod.deb sudo dpkg -i packages-microsoft-prod.deb 現状ではまだ、パッケージがほぼ無いように思える。 まだ、Microsoftのサイト上でも19.04までしか紹介されていないのはパッケージがまだないからでしょうね。

5月 3, 2020 · 1 分 · 38 文字 · Me

ProphetをWindows上のAnacondaにインストールする

前提条件としてはpipを使わないことを前提としています。condaとpipの混合はどう考えても安全性に乏しいので可能な限りcondaだけでいく前提です。 仮想環境の作成 conda create -n prophet_env python=3.7 仮想環境の利用開始 conda activate prophet_env libpythonとm2w64-toolchainパッケージのインストール conda install libpython conda install -c msys2 m2w64-toolchain パッケージのインストール conda install numpy cython matplotlib pandas conda install -c conda-forge fbprophet pystanのテスト import pystan model_code = 'parameters {real y;} model {y ~ normal(0,1);}' model = pystan.StanModel(model_code=model_code) y = model.sampling(n_jobs=1).extract()['y'] print(y.mean())

12月 26, 2019 · 1 分 · 51 文字 · Me