教育者、指導医、管理者は学習者、研修医を様々な理由で評価する必要に迫られる。たとえば、この研修医の当直をひとり立ちさせていいのか?外来をほぼスー パーバイズなしで、やらせていいのか?自分の施設でひきつづき医師として働いてもらうのか?など、成長過程にある医師にたいして、様々な判断が必要にな る。臨床研修の目標に到達しているのか?していないならそれはなぜか?目標に到達させるために、特別に何か手をうつ必要があるのか?評価とは、評価表に記 入したり、研修管理会議用の資料を作ることではなく、こうした日常的な様々な判断をすることに実はそれとしらずに行っているものである。特に卒後臨床研修 における評価は、研修医をグレード付けしたり、優秀な研修医を称揚したり、するところにあるのではないし、卒前教育でもとめられるような評価とも違う。 「実際の現場」の中でその医師に仕事をまかせていいのか悪いのか、究極的には引き続き働いてもらうのか、やめてもらうのかのような判断が必要とされている 点で、大学における卒前教育で議論されるような評価とかなり異なるのである。例えば、ある病院の医師をシニアレジデントとして採用する場合に、大学で行わ れているような筆記試験やOSCEの得点で決めることには違和感を覚えるのではないだろうか?このエッセイでは、臨床の現場でどのように評価するのかにつ いてフォーカスを絞り記述してみたい。
まず、医師の臨床能力とはいったいどういうものなのだろうか?これが明らかにならないと、その医師の臨床能力を評価するためにはどうしたらよいかがわから ない。しかし、この点に関しては、依然として研究段階にあり、決定的なものや多くの医師のコンセンサスを得るものはないと思われる。医師に必要な能力の構 造に関しては、カリキュラムにおける目標(アウトカム)設定についての説明に譲るが、ここでは学習者・研修医の臨床能力評価のレベルの観点から Millerの三角形に基づくこととする。 評価レベルに関するもっとも基本的なフレームワークは「Milerの三角形」である。文献については、Miller GE. The assessment of clinical skills/competence/performance. Acad Med 1990:S63-7を参照されたい。この図について解説しよう。このMillerの三角形は4つの階梯がある。下から、Knows, Knows how, Shows how, Doesと命名されている。おのおのについて説明していこう。
単純に知識があるかどうかというレベルである。多肢選択問題(MCQs)が代表的な評価法である。
持っている知識を実際のケースに即して使いこなすことができるかどうかというレベルである。問題解決型の臨床問題(patient management problems: PMP)が代表的な評価法である。 上記二つは認知レベルの能力のレベルであり、これらの上位レベルのパフォーマンス領域能力の基礎となる。最近のMCQsは単に事実を知っているかどうかだ けでなく、知識を使って問題解決をするレベルを問うことにも使われている。それゆえ、評価法開発の立場からは、KnowsとKnows Howのレベルを分けることはあまり重要でなくなってきたといえるかもしれない。ただし、Knows Howを問う評価法として、日本でも近年注目されてきたものとしてKey features examinationは知っておきたい。これは、どうせ覚えるのなら、将来役に立つべき知識をきちんと覚えてもらう。そのために、ある臨床のシチュエー ション(例えば妊娠7ヶ月の妊婦が出血して来院した)の際に、絶対抑えておかねばならないこと(key features)はなにか、を問う試験である。もう少し厳密に言えば、臨床における問題解決能力は単一の包括的な能力ではない。たとえば、異なる症例問 題を用いて臨床能力を評価した場合に、設問間の評価の相関係数は0.1から0.3程度に留まることが多い。このことからわかるのは、各症例にはそれぞれ特 徴的な課題や要点が含まれている。それがkey featuresである。Key features examinationはある症例を提示して、症状、所見、検査成績、診断、マネージメントの流れをシミュレートした、設問と分岐からなるpatient management problem(PMP)よりも多くの臨床問題を問うことができるため、より結果の信頼性が高いといわれている。症例に関する設問は、少数の症例に関する 網羅的な出題よりも、多数の症例に関するポイントを問うほうが、より学習者の認知レベルをよりよく反映する結果が得られるということである。Key featuresに関しては以下の文献を参考にしてほしい。 Page G, Bordage G. The Medical Council of Canada's key features project: a more valid written examination of clinical decision-making skills. Acad Med. 1995 Feb;70(2):104-10. Page G, Bordage G, Allen T. Developing key-feature problems and examinations to assess clinical decision-making skills. Acad Med. 1995 Mar;70(3):194-201. さて、臨床教育にたずさわる指導医は、認知レベルの上位になる、パフォーマンスレベルの評価法にむしろ関心があるだろう。
普段の臨床に近い場面で示せるパフォーマンスのレベルである。ただし、このレベルでは評価されることが学習者には知らされている。Performance assessment in vitroともいう。代表的な評価法はOSCEである。Competenceは実際に現場で満足できるレベルのパフォーマンスを行うためには必要条件ではあるが、それで十分とはいえない。
毎日の実際に行っている診療や仕事のレベルである。このレベルのパフォーマンスの評価は、performance assessment in vivoと も呼ばれる。代表的な評価法は他職種をふくむ360度評価法(multi-source feedback)があるが、まだ標準的な評価法は定まっているわけではなく、世界中でこの領域についての研究が進行中である。このDoesのレベルが教 育評価における真正性(authenticity)がもっとも高いのである。逆に、教育学的にはKnows(知識)のレベルがもっとも真正性が低いとされる。 さて、卒後研修レベルで必要とされる学習者の評価レベルはDoesのレベルの評価であるといえる。たとえば、繰り返しになるが、この研修医は当直が独り立 ちできるのかという判断をするのに、知識を問う筆記試験の結果をもってするのは無理があるだろう。あるいは、基礎研修終了時に、次の段階のプログラムに採 用するかどうかを決定するのに、OSCEをもってするのは違和感があるに違いない。卒後臨床研修においては、その研修医の実際の仕事ぶりをさまざまな側面 から評価することがもとめられる。そして、ミラーの三角形のDoesはまさにどんな世代の医師にも適応できる、まさに業務の評価そのものであり、英国にお ける実際に試みられつつある、「医師の再認定=再評価」(revalidation)などにもつながる領域である。この領域の評価は近年work- based assessmentと呼ばれている。 さて、このDoesのレベルの評価法に関する研究は近年進んではいるが、まだ決定的なものはないといってよい。しかしながら、これまでの様々な研究の知見から明らかになったポイントは、以下の二つである。 1.単一の評価法で評価することはできない。多くの方法を組み合わせて評価する必要がある。 2.医師の仕事の特性から、単発の評価イベントで、評価することはできない。医師の仕事のサンプリングを、時、場所、シチュエーションを変えて、様々な評価者が評価をおこなうことが必要である。 これらは、自分の施設におけるWork-based assessmentを設計・実践するときの原則となるだろう。