Zennの「Test」のフィード

フィード

記事のアイキャッチ画像
pytestのassertion差分を読んで失敗を10分で切り分ける──最小再現とClaude Codeの頼み方
Zennの「Test」のフィード
pytest が真っ赤になったとき、出力のどこから読んでいますか。スタックトレースの上から眺めて、なんとなく当たりをつけて——という読み方だと、失敗が複数あるときに迷子になります。pytest は失敗の理由を差分(assertion introspection)として丁寧に出してくれます。この記事では、その差分を機械的に読む順番と、原因を確定させる最小再現の作り方、そして Claude Code に「原因の切り分けだけ」を頼むプロンプトを、実行コマンドと期待出力つきで実演します。!対象読者と前提pytest でテストを書いた / 動かしたことがあるエンジニアPython の基...
2日前
記事のアイキャッチ画像
🏃【MagicPod】ブラウザテストエンジンをPlaywrightに変更してみたら、実行速度が段違いになった話
Zennの「Test」のフィード
個人事業主としてQAエンジニアをやっております、マンタスです。2026年6月から、MagicPodがブラウザテストエンジンとしてPlaywrightを公式サポートするようになりました🎉参考:MagicPodのプレスリリースこれまではSeleniumのみでしか実行できなかったため、実行速度が気になるテストが不安定になることがあるCIの待ち時間が長いといった理由から、MagicPodの導入を見送っていた方も一定数いるのではないでしょうか。私も実行速度を改善したいと日々悩んでいたため、参画しているプロジェクトでも早速Playwrightへ切り替えてみました。今回は実際に切...
2日前
記事のアイキャッチ画像
作ったら確認する ── AI時代でも変わらない開発の最初の原則
Zennの「Test」のフィード
はじめにソフトウェア開発を始めると、新しい言葉がたくさん出てきます。!要求分析設計実装単体テスト結合テストシステムテスト最初は「何が何だか分からない」と思う人も多いでしょう。でも、私が新人に最初に伝えたいことは、突き詰めればたった一つです。何かを作ったら、必ず確認する。そして、これを正しく実践するために、もう一つだけ対になる考え方を覚えてほしいと思っています。「作る」と「確認する」は別の仕事である。この記事は、この二つの考え方の話です。 ソフトウェア開発は「作る」の繰り返しソフトウェア開発は難しそうに見えますが、やっていることは意外と...
2日前
記事のアイキャッチ画像
AIによるユニットテスト実装についての所感
Zennの「Test」のフィード
2026年現在、AIエージェントにユニットテストコードを書かせることについての所感。 3行まとめAIにユニットテストを書かせると負債になるテストを書きがちユニットテストを書くべき対象の判断は難しいClaude Opus 4.8、GPT-5.5 はまだ自然にその判断ができるほど賢くない ユニットテストの有効性はアプリケーションの性質に依存するユニットテストコードの有効性は、アプリケーションの性質と設計によって大きく変わる。例えば、APIのように入力と出力が明確なアプリケーションでは、ユニットテストは有効に働きやすい。リクエストに対して期待するレスポンスが明確で検証が...
2日前
記事のアイキャッチ画像
aaaa
Zennの「Test」のフィード
aaaaaa
3日前
記事のアイキャッチ画像
テスト駆動開発 を読んだ実務エンジニアの正直レビュー — どこが効いてどこは古いか
Zennの「Test」のフィード
この本のざっくり要約Kent Beck 著・和田卓人訳『テスト駆動開発』は、テストを先に書き、最小限の実装でそれを通し、リファクタリングするという「Red-Green-Refactor」サイクルを、実際にコードを動かしながら体得させる実践書だ。説明ではなく手を動かすことで、TDD という習慣そのものを染み込ませることを目的としている。 第一部: 多国通貨の実例架空の金融ドメインを題材に、Dollar と Franc の加減算を段階的に実装していく。最初は動くかどうかすら怪しいほど小さなステップを踏む。この「小さく切る」という判断こそが TDD の核心であることを、コードを追...
3日前
記事のアイキャッチ画像
テストがないコードは、いつか「触ってはいけないコード」になる
Zennの「Test」のフィード
はじめに正直なところ、テストコードを書く時間がもったいない、と思ったことはないでしょうか。機能は動いている、納期は迫っている、それでもテストを書くべきだと言われる。本記事では「テストを書きましょう」という話はしません。代わりに、テストがないコードで実際に何が起きるかを、ある小さな修正を起点に時系列で追いかけます。読み終わる頃には、テストがないことの本当のコストがどこにあるのか、その構造が見えているはずです。!サンプルコードはPHP 8.0以降を想定しています。 第1章: ある日の小さな修正依頼題材は送料計算です。いまの仕様は「合計5,000円以上は送料無料、未満は8...
4日前
記事のアイキャッチ画像
# AI生成コードがテスト緑でもすり抜ける理由——相関誤差と、本番前の検証実務
Zennの「Test」のフィード
「テストが緑でも間違っている」をエンジニア向けに。なぜ緑をすり抜けるのか、どんな形で潜むのか、どう検証で落とすか——実務に落とします。 なぜ緑をすり抜けるのか:誤差が相関するテストは「実装が仕様どおりか」を検証しますが、そのオラクル(期待値)も人やAIが書く。実装側の誤差とオラクル側の誤差が独立なら、突き合わせたとき食い違って気づけます。問題は、コードとテストを同じAI・同じ文脈で生成したとき。仕様の読み違い・命名・暗黙の前提がそのまま共有され、両者の誤差が同じ方向に相関します。相関した誤差は突き合わせても打ち消し合わず、一致して「正しく見える」。ここではこれを便宜上「相関誤差」...
4日前
記事のアイキャッチ画像
UIの操作感を確かめるためにAPIをモックする機能を作りました
Zennの「Test」のフィード
クラシル社でAndroidエンジニアをしているkenzoです。アプリの開発において、コードを書く作業はかなりの部分をAIに任せられるようになりました。それでも、UIを作ったり変更したりしたときは、たとえテストが通っていたとしても見た目や動き、手触りが、自分たちのプロダクトとして良いものになっているか、自分の手で触って確かめておきたいですよね。しかし、開発環境のAPIが必ず確認するUIの表示に必要なデータを返してくれるとは限りません。欲しいパターンのデータがそもそも存在しない用意したデータも、期限切れで消えてしまう複数のエンドポイントに依存した画面の状態を再現しにくい安定して...
4日前
記事のアイキャッチ画像
エンジニアは科学者で科学者は駆け出しエンジニア
Zennの「Test」のフィード
バイブコーディングによって、アプリ開発のハードルは一気に下がりました。プロンプトを投げる。画面ができる。ボタンが動く。データが保存される。それっぽいアプリが形になる。すごい時代です。しかし動くものを作れることと、エンジニアとして扱えることは別です。エンジニアの仕事は「動いた」と喜ぶことではありません。作ったものが、期待した条件で、期待した通りに、壊れずに動くかを確かめること。つまり必要なのはテストです。ただ、この「テスト」という言葉は少し誤解されやすい。ソフトウェア開発におけるテストは、学校の試験のように誰かを採点するものとは違います。もっと近い言い方をするなら...
4日前
記事のアイキャッチ画像
【テスト】AI×量子 自動投稿テスト
Zennの「Test」のフィード
テスト記事これはZenn自動投稿のdry-runテストです。 テストセクション項目1: zenn-cliで生成項目2: GitHubにpush項目3: Zennに自動反映本文が正しく入力されるかの確認用です。
5日前
記事のアイキャッチ画像
Code-as-action の威力🔥Webwright 導入で3日規模のE2Eテスト実行が30分になった❗️
Zennの「Test」のフィード
結論E2Eテストを楽にしたくてWebwrightを触っていたら、テストの枠を超えた“気づき”に行き当たりました。Webエージェントの精度は、「AIに何をさせるか」が重要なファクターのようです。Webエージェントは画面を見て「次にどこを押すか」を予測する座標予測より、操作をコードとして書いて実行し、結果をAI自身に検証させるほうが圧倒的に強い。それを見事に体感させてくれたのが Webwright というターミナルネイティブWebエージェント。公式も "Code-as-action beats coordinate prediction"(コードをアクションにするやり方は、座標...
5日前
記事のアイキャッチ画像
AIに「仕様どおり」の成果物を作らせる ── L2A-SCP を V字モデルとして読む
Zennの「Test」のフィード
エージェントに実装を任せると、diff が出る速度は上がる。けれど出てくるのは「動きそうなコード」であって、仕様どおりのソフトウェアとは限らない。Layer2-Architec SPEC Compiling Pipeline (L2A-SCP) が狙う最大のユースケースは、この差を埋めることだ。人間が SPEC を書く。L2A-SCP はその SPEC が成果物へ変換可能かを判定し、可能なら UC・設計・テスト・実装・配送契約へ段階的に展開し、SPEC に忠実な成果物へコンパイルする。これは「AI にいい感じに実装させる」話ではない。SPEC をソースコードのように扱い、そこから成果物...
5日前
記事のアイキャッチ画像
Expo + Jest のテスト基盤は設定を書かないほうが動いた
Zennの「Test」のフィード
はじめに個人開発で Expo Router + TypeScript のアプリを書いていて、ある時から「コアロジックくらいはテストで守りたいな」と思うようになりました。それまでは実機でちまちまさわって確認していたのですが、壊れたら困る部分くらいは機械的に検出できるようにしようと考えました。そこでテスト基盤を入れようとしたのですが、最初の一歩でいきなり詰まりました。公式ドキュメントを見つつ、React Native + Jest のネット記事に載っていた transformIgnorePatterns の設定もあわせて書き写してセットアップしたところ、自分のテストコードにたどり着く...
6日前
記事のアイキャッチ画像
AIのSkillsを、問題集でテストしてみた。Waza風evalをCodexで回す話
Zennの「Test」のフィード
どうも、AIエンジニアの@noprogllamaです。AI(人工知能, Artificial Intelligence)Agent Skillは、AIエージェントに渡す再利用用の手順書です。たとえば、毎晩「今日見る記事を選んで、残タスクも見て、明日に回すものを決めて」とAIに頼むとします。毎回それを口で説明するのは面倒なので、先に手順書としてまとめておく。これがSkillです。手順書は、直すと良くなることがあります。でも、直したつもりで別の場所が壊れることもあります。あるあるですよね。そこで今回は、AI用の問題集を作りました。やったことは、以下の通り。AIに渡す問題を作...
6日前
記事のアイキャッチ画像
検査がほぼ無料になった世界の品質保証 ― AI時代のQA設計と「コードは誰が書くか」
Zennの「Test」のフィード
理想のQAは、ずっと「虚構」だった品質保証(QA)と品質管理(QC)の教科書には、昔から「理想形」が書かれていた。全コードの網羅的レビュー、全モジュールへの高密度なレビュー・解析・テスト基準、常に最新で完全なトレーサビリティ、独立した多重検証。だが、それはほぼ常に 実現できなかった。理由は一つ、コストだ。人間の検査は時間も費用も高い。だから現場は妥協してきた——サンプリング、リスクベースの優先順位づけ、「許容できるカバレッジ」、監査の直前に再構築されるトレーサビリティ。つまり私たちが「QA」と呼んで実践してきたものは、理想そのものではなく、理想を労働予算に射影した近似 だった。...
7日前
記事のアイキャッチ画像
Claude Code に「7人の意地悪なQA」を仕込んでテストケースの観点漏れを潰した
はてなブックマークアイコン 154
Zennの「Test」のフィード
こんにちは、QAエンジニアのAyakaです。製造業向けSaaS(Blazor+Radzen / SQL Server で開発)のテスト設計・品質管理を担当しつつ、最近はコーポレートIT寄りの仕事も兼務しています。テストケースをAIに「書かせる」こと自体は、もう誰でもできます。難しいのは、毎回同じ観点で、同じ品質で書かせることでした。テストケースを作る作業は、わりと早い段階からAIに手伝ってもらっていました。課題(PBI)の説明を渡して「テストケースを出して」と頼めば、それらしいものは返ってきます。最初のうちはそれで足りていました。ただ、しばらく使っていると、AIで作れてはいるの...
7日前
記事のアイキャッチ画像
配慮はするが、遠慮はしない —— 先に聞く・気軽に誘う・場をつくる
Zennの「Test」のフィード
こんにちは、スタディストで QA エンジニアをしている髙津(@mototakatsu)です。先日、スタートアップで働く QA エンジニアのためのコミュニティ「QA engineer at a Startup」(通称 QaaS)のオンラインイベントで、「エンジニアと一緒にテストコードの設計と実装を改善した話」というテーマで登壇しました。この記事では、登壇内容を再現できる形で整理します。QA としてエンジニアのテストコード改善にどう関わったのかを、発表を聴いていない方にも持ち帰っていただけるようにまとめました。QA は、意識していないと「依頼を待つ存在」になりがちです。開発チームとの...
7日前
記事のアイキャッチ画像
「テストが書けない」の正体 〜newをひとつ外に出すだけのDI入門〜
Zennの「Test」のフィード
はじめに「このクラス、ユニットテスト書いといて」と言われて、書こうとして、手が止まった経験はないでしょうか。エラーが出るわけではない、文法もわかる、それでもどうテストすればよいかわからない。結論から書くと、それはテストを書く側の力量の問題ではなく、テスト対象のクラスの作りの問題であることがほとんどです。本記事では「テストが書けないコード」を出発点に、その原因と直し方を順に見ていきます。直し方の正体は、newをひとつ外に出す、それだけです。!サンプルコードはPHP 8.0以降を想定しています(コンストラクタプロパティプロモーション、match式を使用します)。 第1章:...
7日前
記事のアイキャッチ画像
本番エージェント、本当に「黙って壊れてない」? — 4軸で走査したら自分が50点だった
Zennの「Test」のフィード
前回の振り返り前回の記事では、エージェントが本番環境でひっそりと機能不全に陥る、そんな悲劇的なシナリオを物理的に回避する術をご紹介しました。前回の v0.2 記事では、具体的な4つの「黙って壊れる」場面と、それらを防ぐための実践的なパターンを実験的に示しました。では、その対策が本当に機能しているのか、どうやって確認すれば良いのでしょうか?今回は、そのパターンが満たされているかを100点満点で採点する CLI を実装しました。正直なところ、このCLIを開発した我々自身、まさか最初にその洗礼を受けるとは思いませんでしたが、最初に落ちたのがその CLI 自身だったのです。今回は、その衝...
7日前