Splatoon2 に向けてボイスチャット環境を変えた

Splatoonをやる時はイヤホンとヘッドセットを同時に装着していたので耳が痛くなっていた。
ヘッドセットが壊れたのと、Splatoon2が発売されることを考えてボイスチャット環境を見直した。

ゲーム音とPCの音をミキサーで混ぜてヘッドセットにつなぐことで、ヘッドホンとイヤホンの同時装着から解放され、各音量をツマミで調整できるようになった。

買ったもの

ミキサー: YAMAHA AG03

YAMAHA ウェブキャスティングミキサー 3チャンネル AG03

YAMAHA ウェブキャスティングミキサー 3チャンネル AG03

ヘッドセット: Logicool G430

ケーブル: audio-technica ATL462A/1.5
http://www.yodobashi.com/product/100000001001251353/


ゲームの音(GamePad, Switch, AVT-C875から)とPCからの音をパソコンの外で混ぜたいのでミキサーを使用する。
ミキサーについては全然分からなかったので、先例があった(Splatoon での VC 環境について - モノトーンの伝説日記)AG03を買ってみた。
AG03のブロック図は下の記事のリンクにあるので、参考になるかもしれない。
http://www.dtmstation.com/archives/51931706.html

ヘッドセットはPCでFPSなどをやることを考えてサラウンド対応のものにした。
ステレオミニプラグで接続できることを確かめる。(USBのみのやつはダメ)

接続例

接続はこんな感じになる。
f:id:piroz95:20170614234845j:plain

背面でUSBケーブルがPCと繋がっている。
ヘッドセットは中央につなぐ。
ゲームからの音声は、ステレオミニプラグ→モノラル標準プラグ×2の変換ケーブルを使って上部2/3につなぐ。

自分の声を聞かないようにするために右下のMONITOR MUTEボタンを押す。

TO PCのスイッチはDRY CH 1-2Gにする。その他にするとゲーム音などの余計な音もPCに送られる。
この場合一番左のスライダーはマイク音量に関係しない。マイク音量の調整は中央左のツマミを使う。
(あとエフェクトをかけられなくなる)

一番下のツマミの左がゲーム音、真ん中がPCからの音、右が全体の音に対応する。

ゲーム音はAUXを通して入れてもOK。使うケーブルが違う。この場合ツマミでゲーム音を調整できないのでちょっとダサい。

ACM-ICPC 2017 World Final 参加記

バンコク大会で3位(サブリージョンで2位)で、World Final参加権を得ました。(バンコク行ってた時はFinal行けると思ってなかった)

東工大・チームpo(僕,yosupo,dnk,コーチhadrori)は5完で34位でした。
ちなみにペナルティ込みだと51位です。
応援・協力して頂いたみなさんありがとうございました。

本番のチームとしてのパフォーマンスはイマイチ目だったので悔しいです。

写真とかはここに多分あります。
icpcnews.com
トップの流れる画像4枚の一つにプラクティス中のチームの様子が映っててビックリ。

コンテスト

(覚えてる限り)

バンコクの時と同じくとりあえず3分割して並列に読むところからスタート。
僕はAから読み始めて、Aは幾何なのでパス、Bは超面倒系か?正確に読めなかったのでパス、Cは概要が簡単でまだ解けそう
Cの概要をよすぽに伝えて、解法を考えてもらった。
が、ここで箱を取るだけで移動できないと思いこんで伝えてしまう大失敗をした。

Cは最小流量制約付き最小費用流で解けるとよすぽに聞いたが、僕が組めないので実装をdnkにパス。
よすぽにスライド最小値覚えてますかって聞かれる→覚えてないのでパス

I問題の概要をよすぽに伝えて、僕は変換規則は単語だと思っていたんだけど、文字と言われてそうだねやるだけだねとなった。
Iを実装してAC。

順位表からFが簡単らしいので読んで概要をよすぽに伝えて、DP解法を貰った。
このときCかDのデバッグでパソコン空いてなかったので紙で実装を詰めるのと空いた時に書くのを往復して通した。

このあとはいろんな問題を読んで、B考えてこれはSATソルバーが無いと無理でしょwとなって、Gの考察を始めた。
Gの考察中にCの誤読が判明した(絶望)
Cを読み直して正しい概要をよすぽに投げる。

Gはよすぽと相談しながら解いていった。ノートを塗って色々実験した。
サンプルが通ったあと、提出してRE。アサーションに引っかかってそうなのでランダムケースを食わせてみて実験。
気づいていないコーナーケース(これ→###)があって、修正。
それでも通らなくてよすぽにデバッグしてもらって修正、AC。

最後は詰まってるAのライブラリ写経ミスがないか調べたり祈ったりしてた。

反省

個人の部分では、要精進(毎回言ってる)を除くと、
C:思い込みで違う問題を伝えてしまったので最悪
I:ちゃんと読めてたら別に相談しなくてもよかった
F:これくらいの問題は相談しなくても解けるようにしたいかも?
G:これが通せたのは良かった

ラピッドシティと色々

サマータイム込みで日本との時差が-15時間。
日本→デンバーだと東回りで時間が巻き戻る。

日本と比べると緯度と標高が高くて、寒くて乾燥してた。


大統領の顔の彫刻があるラシュモア山で有名。
チームの顔をスキャンしてラシュモア山の彫刻っぽく3Dプリントしてくれたやつをもらえた。
f:id:piroz95:20170614232415j:plain
正直どれが誰かを判別するのは結構難しい。


Finalの前の日の夜にダウンタウンに出て肉を食べた。
f:id:piroz95:20170614232118j:plain
量が少なすぎるように見えるが、肉が超分厚くてこれでも7oz(200gくらい)。


これはラピッドシティからデンバーに帰る途中の機内から撮影したアメリカン農業
f:id:piroz95:20170614232508j:plain

英語

気を使ってくれないと厳しい。
ギリギリできたのがフロントに電話して歯ブラシと歯磨き粉をもらうレベル。
ラピッドシティからデンバーに飛ぶ前、搭乗ゲートで止められて早口で喋られて分からんって言ったら席を替えられた。
(非常口付近の席は非常時にコミュニケーションを取れる人が座る必要があるため)

今後

今年のICPCに参加するかは未定です

RCO presents 日本橋ハーフマラソン 参加記

ハーフマラソン(走らない)

予選

A19位,B9位で総合8位でした。


やったことが解説の想定とほぼ同じだった。
www.rco.recruit.co.jp

本戦

RCO presents 日本橋ハーフマラソン 本戦 - RCO presents 日本橋ハーフマラソン 本戦 | AtCoder

A45位,B39位で総合46位でした😇
めちゃくちゃ冷えてます

学生10位まで賞金出るって聞いたとき狙えると思ったんですが本戦全然ダメでしたね・・・
さすがに悔しかったので時間をかけて復習していましたが、本戦1位のmamekinさんのスコアが抜けません

A問題

本戦中

クエリあたりの効率が大事な気がしたので、来た客に対して何手で渡せるか求めようとした。
ここで幅優先探索でなぜかいい感じなると思って実装してしまった。
実際の所、いい客には沢山のタンクを使う必要があるので3手程度しか読めない探索では何も出来ない。これは本番後に気づいた。
ここに2時間半費やして、最終的に下から2番目の点数だったので大事故となった。

練習

まず、来た客にたいしてfillとsellだけで売れたら売る、売れないならskipという貪欲を書いた。
これだけで本戦のスコアの1.5倍が出た。(3.4M点)

その後、
・Dの低い客を無視して小さいタンクにchangeを繰り返す(5.0M点)
・客が来る前に大きいタンクにfillしておく(6.2M点)
でスコアが上がった。

今の手持ちで、Dが一定以上の客が来た場合の稼げる期待値のようなものをスコアにして、fillとchangeを使った1手先のスコアの期待値を最大化するようにしたら、点数が7.3M程度に激増した。
1手読みのような凝ったことをしている人はあまり居なくて、changeやfillのルールとしきい値をうまく調整すると同程度の得点が取れる模様。

B問題

本戦中

実際の道路を参考に一方通行とか交差点を駆使すればいけるんじゃないかと思い、一部のマスでは移動できる方向を制限するようなことを考えた。
Aで時間を食っていたこともあって、結局まともな実装ができずほとんど点が取れなかった。

練習

目的地に向かう動きとランダムに動く動きをうまく混ぜるといい感じになるらしい。

・できるだけ目的地に向かっていくが、停止するのを禁止する。
・同じ距離になる場合はランダムに向きを選ぶ
・行動順はランダムに決める
でかなりいい感じに動くことが分かった。

終盤になったら停止を許可してできるだけ近づくといい感じになる。(6.7K点)

ここで引っかかって抜けられなくなってるやつがまだ残ってるので、5ターン中2ターンランダムに動かすと点数が伸びた。(388K点)

それでもまだ引っかかってるやつが残るので、これをスコアを下げずにいい感じにしたかったが面倒そうなので諦めた。

他の方針として、片側に詰めて並べていって最後にバッと戻す方針というのもあって、それも実装してみた。(497K点)

市松模様に並べて動かしていくという方針もあるが、これはめちゃくちゃ難しそう。

この問題の設定、見覚えがあると思って調べた所、Asymmetric Simple Exclusion Processと呼ばれているらしい。

反省や感想

今回は最初に間違った方針で、しかも重い実装に取り掛かってしまったので取り返しのつかないことになった。
まず最初に貪欲を考えるという方針が良いような気がする。
しかし、CODE RUNNERの2回目の予選A(交わらないように直線を引くやつ)のように、貪欲よりも頭の良い解法が圧倒的に良い場合もあるのでそのあたりは難しいなあと思った。
短時間マラソンでは、自信のない重い実装はやめたほうがよさそう。

その他:
・東京駅から徒歩2分、乗り継ぎもなかったのでめちゃくちゃ楽だった
・企業紹介と文章要約アルゴリズムについてのスライド?はどちらも面白かった。(途中で置いていかれた)
・懇親会は主にピザ🍕とフライドチキン🍗

2-SATを探索で解く方法とyukicoder No.470 Inverse S+T Problem

2-SATを想定解とする問題をyukicoderで出題しました。
No.470 Inverse S+T Problem - yukicoder

想定解通りの2-SAT解法とは別に、計算量のよく分からない探索を結構通されてしまいました。
探索解の中に正当なものがあるのか、調べていたところ2-SATを暗黙的に解いている提出が見つかりました。
たとえばヘクトさんの提出です。

その解き方というのが、Wikipediaの2-SATの解法の一つとして載っているLimited backtrakingです。
2-satisfiability - Wikipedia
http://epubs.siam.org/doi/abs/10.1137/0205048

例を用いて大雑把に説明します。
 (\lnot x_1 \lor x_2) \land (\lnot x_1 \lor \lnot x_2) \land (\lnot x_1 \lor x_5) \land (x_1 \lor x_3) \land (\lnot x_3 \lor x_4) \land (x_5 \lor x_6)
が充足可能か調べましょう。

真であると分かったリテラルの集合を Tで表します。
まず適当な変数を選び( x_1とします)真だと仮定します。( T = \{ x_1 \})
 \lnot x_1は偽になるので、このリテラルを含む節では、もう片方が真になる必要があります。
1つめの節から T x_2を加えます。
2つめの節から T \lnot x_2を加えます。
ここで T = \{ x_1, x_2, \lnot x_2 \}となり、矛盾が見つかりました。

今度は x_1が偽だと仮定します。( T = \{ \lnot x_1 \})
 x_1を含む節に注目します。
4つめの節から T x_3を加えます。
 x_1を含む節は1つだけです。新たに Tに加わった x_3に対して、 \lnot x_3を含み、真であることが確定していない節に注目します。
5つめの節から T x_4を加えます。
これで( T = \{ \lnot x_1, x_3, x_4\})になりました。これ以上 Tに追加することもできませんし、矛盾もみつかりませんでした。

 Tに含まれているリテラルを含むような節は、残りの変数の値によらず真になります。
そうでない節は、 Tに出てくる変数を含みません。この例では、 (x_5 \lor x_6)が余っています。

残った小さな問題についてこの手続を繰り返していきます。最終的に節が無くなれば残りの変数は適当に決めてよいです。
もし部分的な式が充足不能ならば全体も充足不能ですし、部分的な式が充足可能ならばいままでに確定した真偽の割り当てと合わせて全体が充足可能です。


ある程度無駄を省けば計算量は O(nc)になると思います(nが変数の数,cが節の数)。
このアプローチでも工夫すると線形時間で解けるらしいです。

ARC066/ABC050 D: Xor Sum - OEISからの解法

コンテスト中に解けませんでした。

解法

小さい Nに対して実験してOEISで検索します。
2,4,5,8,10,13,14,18,21,26,28,33,36,40,41 - OEIS

A007729が答えになりそうですが、残念ながらいい感じに求める式は見つかりません。
しかし、この数列はA002487の部分和で表されることが分かります。

A002487の一般項は次にように表せます。

\begin{eqnarray}
s(n) =
  \begin{cases}
    n & (0 \leq n \leq 1) \\
    s(n/2) & (n \geq 2, nが偶数) \\
    s((n-1)/2) + s((n+1)/2) & (n \geq 2, nが奇数) \\
  \end{cases}
\end{eqnarray}

これの部分和f(n)=\sum_{i=0}^n s(i)を頑張って式変形します。

n \geq 3のとき、
 s(0)=0であることを用いて、

\begin{eqnarray}
f(n) & = & \sum_{i=0}^n s(i) \\
     & = & s(0) + s(1) + \sum_{i=1}^{\lfloor n/2 \rfloor} s(2i) + \sum_{i=1}^{\lfloor (n-1)/2 \rfloor} s(2i+1) \\
     & = & s(0) + s(1) + \sum_{i=1}^{\lfloor n/2 \rfloor} s(i) + \sum_{i=1}^{\lfloor (n-1)/2 \rfloor} \{s(i) + s(i+1)\} \\
     & = & \sum_{i=0}^{\lfloor n/2 \rfloor} s(i) + \sum_{i=0}^{\lfloor (n-1)/2 \rfloor} s(i) + \sum_{i=0}^{\lfloor (n-1)/2 \rfloor +1} s(i) \\
     & = & f(\lfloor n / 2 \rfloor) + f(\lfloor (n-1) / 2 \rfloor) + f(\lfloor (n+1) / 2 \rfloor)
\end{eqnarray}

これであとはメモ化再帰f(N+1)を出力すると解けます。

ソースコード

import java.util.HashMap;
import java.util.Scanner;

public class Main {
	public static long MOD = 1000000007;
	public static void main(String[] args) {
		Scanner sc = new Scanner(System.in);
		long n = sc.nextLong();
		System.out.println(f(n+1));
	}
	static HashMap<Long, Long> hm = new HashMap<>();
	public static long f(long n) {
		Long memo = hm.get(n);
		if (memo != null) return memo;
		if (n <= 2) {
			return n;
		}
		long res = f(n/2) + f((n-1)/2) + f((n+1)/2);
		res %= MOD;
		hm.put(n, res);
		return res;
	}
}

計算量

メモ化再帰の遷移に注目すると、三つ又に分かれているように見えます。
n2で割っていっているのでいつかはnが小さい値になることは分かりますが、途中で状態数が爆発しないのでしょうか?
実はこの遷移では大丈夫です。

ある呼び出しの深さにおいて、引数nの取りうる値がx以上x+a未満だったとします。
次の深さにおいて、引数nの取りうる値は \lfloor (x-1)/2 \rfloor以上 \lfloor (x+a+1)/2 \rfloor未満になります。
この幅はfloorを無視して(a+2)/2程度になるので、引数の取り得る値の幅は結局定数になります。

したがって計算量は再帰の深さと同じO(\log N)です。
再帰の形がf((n+a)/b)(ただしb(>1),aは定数)の形の時は安心してよさそうです。

CODE VS for STUDENT 参加記

初戦でkimiyukiさんに負けてベスト8です?

AIの概要はこっちに書いてあります。
piroz.hatenablog.com

もう決勝からだいぶたっていてタイムシフトも消えてしまったのでかなり記憶が薄いです。
権利上の関係とかで動画にはならないのかな~~~

決勝当日

チームラボ本社は水道橋にある。
行くのは二度目だが出口を間違えて知らないところに出た。
その日東京ドームでライブがあるせいかわからなかったが人が多かった。

12:00に本社に突入したらまだリハーサルをしていてダメだった。(受付開始12:30と書いてあったので自分が悪い)
(どうでもいいけどエレベーター降りるとすぐオフィス内でビビる)

昼を食べてなかったので駅の方まで戻ってすき家で食べて、12:30に再突入した。
カメラやら配信機材やらが色々あってすごい。

Normal

人が足りてない・・・?
上位の方はちゃんと探索して連鎖してた。見てて面白かった。

Hard

第一回戦第二試合が僕 vs kimiyukiさん。
予選では割と勝ち越してる相手だったのですがダメでしたね・・・
予選から決勝までの間に全然強化できなかったのが悔しいです。
コメントでも言ったけどトーナメントなので初戦負けるとバイバイで悲しい。

僕のAIは200以上そんなに出ないんだけど他の人たちは250~500くらいをポンポン出し、1000まで叩き出していたのでもうこれは勝てそうにないという感じだった。

当日色々

参加者全員にスポンサーから色々配られていたが、スクエニからはスライムが描かれたペットボトルカバーが貰えた。
懇親会は酒&ピザだった。

決勝AIの反省

前回の記事の通り機械学習がバグっていてパラメータがおかしい可能性があった。
また、ハイパースレッディングが有効だったので、2スレッド実行すれば若干速くなるのではと2スレッドにしたら競合していた(最悪)。

他の参加者と話していて結局敗因は何かということを考えた。
今回のゲームの場合、評価関数を凝るよりはいかに探索を頑張るかという所のほうが重要なんだと思った。
連鎖のチェックをする場所を限定して盤面の評価を速くしたり、発火ターンを限定して読む幅を増やすのが効果的なのだと思う。
これらは試してみて今のAIと戦わせてみたい。

結局機械学習でAI強くできたの

冷静に100先をさせたところ、ベースの評価関数よりは明らかに強くなっていた。

ベース 決勝提出 バグ修正
ベース - 72-100 61-100
決勝提出 100-72 - 88-100
バグ修正 100-61 100-88 -

(これらAIはパラメータのみが異なる。ただし、ベースはパラメータすべて0と考える。)

最後に

CODE VSで入賞したいからまた開催してください~~~~~

ここからは予選~決勝のログ(を整理したもの)です。

続きを読む

CODE VS for STUDENT で作ったAI、「MazAI」の紹介

CODE VS for STUDENTの決勝用AI提出が完了しました!

残念ながら、予選通過したバージョンからいい感じの改良ができず、実質的にはわずかなバグ修正だけで終わってしまいました。
予選通過したときの記事にも貼ったAIの動画がこれです↓
youtu.be

提出したAIの内容を紹介したいと思います。
名前は「MazAI」です。
決勝AIは名前が「MazAI-Z」になっています。マザイゼットです。

提出したAIの概要

敵の盤面は見ずに、一人ゲームとして処理した。

評価関数

すべての列に1~9のブロックを落とし、最大スコアの連鎖を記録。
スコア = 連鎖数 * 1000 + log_10(連鎖スコア) * 1000
また、一定数以上の連鎖をしたノードには送ったオジャマ数*1000点を加算する。

このスコアに以下の値に係数をかけたものを足す。

  • 予告オジャマ数
  • フィールドのオジャマ数合計
  • フィールドの色ブロック数合計
  • 和が10になる特定の配置の数(5種類)

f:id:piroz95:20161206230025p:plain

  • 各列の高さ(10列)
  • 各列の高さの差の絶対値(9列)
  • 最大連鎖
  • 最大連鎖の消費ブロック数 / 連鎖数
  • 最大連鎖の発火点の高さ

合計30次元

係数は機械学習を使って決めた。
詳しくは後述する。

探索

送れるオジャマの数が200を越えたら即発火する。
ビームスタックサーチ(chokudaiサーチ)を用いた。
ハッシュ(zobrist hash)による重複消去を実装した。
最初の発火までは深さ13・時間2500ms。
発火後は、深さ10・時間1500ms。
発火したノード(お邪魔を一定以上送ったノード)はそれ以上展開せず、ビームとは別に保存する。
発火ノードが存在しない時はビームサーチの結果を普通に使う。
発火ノードが存在するとき、そのいずれかに向かう。
発火ノードのうち、スコアと発火ターンで見て下位互換になっているものは候補から消しておく。
また、送るオジャマの数が200を超える発火ノードは最も早いものだけ残す。
向かうノードはノードのスコア/1.11^ターン数が最も高いものを採用した。

評価関数の係数の自動調整

「将棋 機械学習」でググったら出てきた
近年のコンピュータ将棋の急速な伸びの理由は? | やねうら王 公式サイト
に影響を受けてやってみました。
(けどよく分からなかったので助けてほしいです。)

Xを盤面とする。
Xの特徴値ベクトルを小文字でxと表すことにする。
特徴値を計算する関数を\phiとすればx=\phi(X)とも書ける。

ベースの評価関数の評価値をf(X),パラメータベクトルをwとする。
機械学習付き評価関数の評価値f'(X)を次のようにする。
f'(X) = f(X) + w^T x
(w^T xwx内積)

このとき、浅い探索の評価値を深い探索をしたときの評価値に近づけるということを考える。
Xからベースの評価関数の値を用いてi手読んだ結果の最良の盤面をX_iと表す。
 s,ds < dを満たす定数として、wを調整して次の式を最小化したい。
\{f(X_d) - f'(X_s)\}^2
つまり次式の最小化になる。
\{f(X_d) - f(X_s) - w^T x_s\}^2

ここまで1つの盤面Xについて考えたが、実際は複数の教師データについていい感じになるようにする。
盤面Xに対して教師データを(x_s,f(X_d) - f(X_s))とする。
N個の教師データを\{(x^{(1)},y^{(1)}),(x^{(2)},y^{(2)}),\dots,(x^{(N)},y^{(N)})\}と表すと、
wに対する目的関数L(w)
L(w) = \frac{1}{N} \sum_i^{N} (y^{(i)} - w^T x^{(i)})^2
で表されて、これを最小化する。

これは微分可能な連続最適化の問題になり、勾配降下法を使うことができるが、勾配の計算が重いので代わりに確率的勾配降下法(SGD)を用いる。
SGDの学習率の更新にはAdaGradを使った。

あとは、特徴量に正規化をかけたりL2正則化を入れた。

 s,dは、最終的には s=0,d=5とした。
教師データは実際の対戦における自陣の盤面を使用した。

機械学習失敗話
  • 正直、よく分からずに使っている部分があってパラメータおみくじみたいになった。
  • 正規化を入れないとヤバかった気がする。(追記:正規化がバグってた)
  • 改良したAIの対戦から教師データを取ったらなぜか弱くなったことがあった。
  • 教師データの数を増やしたら弱くなったことがあった。
  • 特徴量は2000次元くらいのものも試したが最終的に30次元の方が強かった。
    • 30次元の特徴量は色々な特徴量をぶちこんだ所から係数が大きいものを人力チョイスした。
  • ここを書いていて不安になって機械学習なしバージョンと戦わせ始めたら連敗した
    • 追記:2-3くらいの割合で負けた

追記:
takaptさんにtwitterでリプを頂いてやり取りしていたら、正規化する時に分散の計算をバグらせていたことが分かりました。
takaptさんありがとうございました。
 \sigma^2 = E(X^2) - E(X)^2を計算するところを1箇所Nで割り忘れていて[\sigma^2 = N E(X^2) - E(X)^2]を計算していました。
このバグった正規化の結果から何を学習していたのかは謎です。
次元数を減らして強くなったというのは、特徴量の計算時間が減って探索ノード数が増えたという可能性があります。
悲しい・・・

週末に決勝

チームラボ本社で決勝?
live.nicovideo.jp

2ヶ月くらいの間どういうことを試していたかの記事はまた別に書きます。