国際関係業務

「新医薬品の承認に必要な用量―反応関係の検討のための指針」について

薬審第494号
平成6年7月25日

各都道府県衛生主管部（局）長　殿

厚生省薬務局審査課長

「新医薬品の承認に必要な用量―反応関係の検討のための指針」について

　近年, 優れた新医薬品の地球的規模での研究開発の促進と患者への迅速な提供を図るため, 承認審査資料の国際的ハーモナイゼーション推進の必要性が指摘されている。
このような要請に応えるため, 日・米・EC三極医薬品承認審査ハーモナイゼーション国際会議（ICH）が組織され, 品質, 安全性及び有効性の3分野でハーモナイゼーションの促進を図るための活動が行われている。
本指針は, 新医薬品の承認に必要な用量―反応関係の検討について, ICHにおける三極の合意事項に基づき, その標準的と思われる方法を示したものである。
貴管下関係業者に対し周知方よろしくご配慮願いたい。
なお, 用量反応試験の考え方については, 平成4年6月に公表された「新医薬品の臨床評価に関する一般指針」において, 後期臨床第「相試験に関する説明の中で触れられているところであるが, 本指針は, この一般指針を補完するものである。

新医薬品の承認に必要な用量―反応関係の検討のための指針

1．はじめに
1）用量―反応関係の検討の目的
　医薬品の用量, 血中濃度および臨床での反応（有効性および副作用）の3者の関係を知ることは, 個々の患者に対して医薬品を安全かつ有効に使用するために大切なことである。この情報は, 適切な開始用量, 特定の患者の必要性に合わせて用量を調整する最もよい方法や, また, 増量してもそれ以上有益性が期待できないか, あるいは増量すると忍容できない副作用が発現すると思われる用量を見いだすために役立つ。用量―血中濃度, 血中濃度―反応, 用量―反応に関する情報は, 当該医薬品の用法・用量を決める際の参考となる。さらに, 用量―反応関係の情報を得ることで, 各国の規制当局が医薬品の承認の可否を判断する際に共通のデータベースを用いることも可能になり, 世界的にみた医薬品開発を経済的に進めることにつながるであろう。
　過去をみると, 後に過剰用量とみなされるような用量（すなわち期待する効果に関する用量―反応曲線のプラトー部分に十分に達している用量）で当初医薬品が市販されたことがあり, 時には有害な結果（例えば, 高血圧症に使われるサイアザイド系利尿薬で起こる低カリウム血症およびその他の代謝障害）が生じたこともあった。このような状況は, 有用な効果が認められる最低の用量, あるいは有益な効果がそれ以上は認められなくなる最大の用量の探索の試みにより改善されてはきた。しかし, これらの用量を正確に決定するための実施可能な試験デザインは存在しない。さらにその後の情報により, 最小有効量および最大有用量の考え方では個体差は十分に説明できず, また複数の用量における有益な効果と望ましくない効果の比較はできないことが示された。どの用量についても望ましい効果および望ましくない効果が混在し, 全ての患者にとって必ず至適となるある決まった用量は存在しない。

2）用量選択における用量―反応情報の利用
　医薬品の開始用量を選択する際に最も役立つことは, 望ましい効果および望ましくない効果の双方について母集団の（群としての）平均的な用量―反応曲線の形状および位置を知ることである。この情報に基づき, さらに望ましい効果と望ましくない効果の相対的重要性に関する判断を加味して用量を選択することが最も望ましい。例えば, 有用な効果を示す用量範囲と望ましくない効果を示す用量範囲との間に大きな分離が見られるような医薬品の場合, あるいは急速に進行する疾患であるために即効的な治療が要求される場合には, 開始用量を比較的高く（有効性の用量―反応曲線上のプラトーの上, またはその近く260Topic　E4 に）設定することが推奨される。しかし, 有用な効果を示す用量範囲と望ましくない効果を示す用量範囲との間の分離が小さいことが判っている医薬品の場合には, 開始用量を高く設定することは薦められない。このような場合は, 少なくとも患者母集団の一部においては臨床的な有効性が認められる程度の低い開始用量が推奨され, 医薬品が十分忍容される限り用量を漸増することが最もよいと思われる。開始用量の選択は, ある血中濃度における薬力学的反応の患者間での相違, あるいは非線形動態, 代謝の多型性または薬物動態学的な薬物相互作用等から生じうる薬物動態の患者間での相違によって左右されるであろう。これらの場合, 血中濃度が高くなる患者に対しては低い開始用量を用いた方が安全であろう。同じデータを用いてもリスク・ベネフィットを異なった観点からみるために, 適切な開始用量, 投与量の漸増の刻み, および最大の推奨用量について医師によりあるいは規制当局によってですら異なった選択をすることがありうる。用量―反応データが妥当ならば, このような判断が可能となる。
　個々の患者の開始用量に対する反応を観察した後に用量を調整する際, 最も役立つことは, 個々の患者の用量―反応曲線の形状に関する情報である。これは, 通常は母集団の（群としての）平均的な用量―反応曲線と同じではない。従って, 個々の患者の用量―反応曲線の推定を可能にするような試験デザインは, 漸増法の指針として役立ちうる。しかしながら, このようなデザインおよびその分析についての経験は非常に限られている。
　用量―反応情報を利用する際には, 医薬品の薬物動態の個体差をもたらす因子が何であるかを可能な限り明らかにすることが重要である。その因子には, 人口統計学的因子（例えば年齢, 性別, 人種）, 他の疾患（例えば腎あるいは肝障害）, 食事, 併用療法, 個々の患者の特徴（例えば体重, 体型, 併用薬, 代謝の相違）が含まれる。

3）血中濃度―反応情報の利用
　血中濃度のモニタリングをしなければ医薬品を安全かつ有効に使用できない場合は, 血中濃度―反応情報の重要性は明らかである。その他の場合は, 血中濃度―反応関係の確立は常には必要ではないが, 薬物―疾患（例えば腎障害)相互作用または薬物間相互作用による薬物動態の相違, あるいは新剤型（例えば徐放性製剤）または新しい投与方法により変化した薬物動態の影響を評価する場合の臨床的な影響の大きさを確かめるために使用できると思われる。前向きの無作為化血中濃度―反応試験は, 血中濃度モニタリングによる治療の適切な範囲を決めるために不可欠であるが, 患者間の薬物動態の相違が大きい場合にも役立つ。後者の場合, 原則として標準的な用量―反応試験に比しより少ない対象患者を用いた前向き試験により血中濃度―反応関係が認められるであろう。血中濃度―反応情報を集めることは, 医薬品を適切に投与するために治療用量―反応関係の指針261中の血中薬物濃度モニタリングが必要になるということを意味するわけではない。血中濃度―反応関係は用量―反応関係に置き換えることが可能である。代わりとして, もし血中濃度と観察された結果（例えば, 望ましくない薬理作用あるいは望ましい薬理作用）との関係が明らかにされるならば, それ以上血中濃度のモニタリングを実施しなくても患者の反応を調節することができる。血中濃度―反応情報があれば, （それぞれの用量によって得られる血中濃度の範囲に基づき）望ましい反応が最も確実に得られそうな用量を選ぶことが可能になる。

4）漸増法の問題点
　有効性を証明するために広く用いられている試験デザインとして, 何らかの有効性あるいは安全性をエンドポイントとした用量漸増法が用いられる。このような漸増デザインは, 注意深い分析をしない限り通常は用量―反応関係に関する有益な情報を提供するものではない。多くの試験において時間経過に伴う自然経過によって症状の改善する傾向が見られるが, それと増量したこと, または投与期間が長くなったことによる改善とを容易には区別できない。そのため, このような試験で用いられた用量の中で十分忍容性があると認められた最大の用量が, 推奨用量として選択される傾向が生ずる。過去を見ると, この方法は真に必要な用量をかなり上回る用量へ導いてしまうことがしばしばあった。その結果として, 例えば高血圧症に用いられる利尿薬の用量が高かったという事例のように, 望ましくない効果が増大することがある。早急に答えを出すことがとりわけ重要な場合には, 忍容できる最大用量まで漸増する方法が容認できる。なぜなら, 必要な患者数がしばしば少なくて済むからである。例えばAIDS患者の治療に対するジドブジンは, 当初は高用量での試験成績に基づいて承認されたが, 後の試験でより低い用量でも同様に有効であり, しかも忍容性がはるかによいことが示された。初めての有効な抗HIV療法が緊急に必要であったために（市販後にさらにデータを追加するという条件付きで）承認の時点では用量―反応情報が不十分でも可とされたのである。しかし, 緊急性が低い場合にはこのような方法は認められない。

5）用量―反応関係と時間との相互作用
　個々の患者に対する投与量の選択は, しばしば投与頻度と関連している。一般に投与間隔が薬物の消失半減期に比べて長い場合には, 選択した投与間隔を薬力学的に説明することに注意を向けるべきである。例えば, 同じ投与量について投与間隔が長い場合と, より小刻みに分割して投与する場合との比較が挙げられる。その場合は, 可能であれば次の投与時まで期待している効果が持続するかどうか, および血中濃度のピークに伴う副作用を観察する。一回の投与間隔の中でみるとピークおよびトラフの時点の血中濃度における用量―反応関係が異なることがあり, 用量―反応関係が選択した投与間隔に依存しているこ262Topic　E4 ともありうる。
　用量―反応試験においては, 他の様々な面からも時間を考慮に入れるべきである。医薬品の効果発現の遅れが薬物動態学的, または薬力学的因子の結果である場合でも, 所定の用量を用いた試験期間は, 最大の効果が発現するのに十分な長さとすべきである。朝方の投与と夕方の投与とでも用量―反応関係が異なることもある。同様に, 投与初期の用量―反応関係とそれ以後投与を継続した後のそれとが異なることもある。反応が一日用量ではなく, むしろ累積用量, 投与期間（例えばタキフィラキシー, 忍容性, または履歴現象）あるいは投与と食事との関係に関係していることもありうる。

2．用量―反応情報の収集,
1）用量―反応関係の評価は, 医薬品の開発過程に不可欠なものとすべきである
　用量―反応関係の評価は, 医薬品の開発過程に不可欠なものとすべきである。医薬品の開発過程には, その医薬品の安全性および有効性の確立に当然あるべき事項として用量―反応の評価のためにデザインされた試験を含めるべきである。用量―反応情報の収集が開発過程の一部として組み込まれているならば, 用量―反応関係を無視した開発計画に比べ通常は時間の無駄もなく, 余分な努力も最小限で済むことになろう。

2）致死的な疾患における試験
　特定の治療分野においては, 様々な治療や研究の仕方が発展してきており, これらがその分野で行われる典型的な試験の種類に影響している。致死的な感染症あるいは治癒する可能性のある腫瘍のような特定の状態を対象とする試験においては, 少なくとも既知の有効な治療が存在するならば, プラセボ対照を含む並行群間比較による用量―反応試験, あるいはプラセボ対照をおいた漸増法（狭心症, うつ病, 高血圧症などの試験において典型的に用いられている非常に効果的なデザイン）は容認されないであろう。さらに, これらの治療分野ではある程度の副作用が許容されうるので, 可能な限り最大限の有益な効果を速やかに達成するために, 通常は比較的高い用量が選択される。この方法では, 治療の中止をきたすような副作用により患者から医薬品の潜在的な有益性を奪ってしまうような用量を推奨用量としてしまう可能性がある。他方, 有効用量より低い可能性のある用量を用いたり, 期待している効果が出るまで漸増することは容認されないと思われる。なぜなら初期の治療に失敗すると, その患者にとって治癒する機会が永遠に失われてしまう恐れもあるからである。
　それでもなお致死的な疾患の場合であっても, 医薬品開発者は常に様々な治療方法の利益と損失とを秤にかけ, 用量, 投与間隔および漸増の刻みをどのように最適に選択するかを考慮するべきである。致死的な疾患に関連した適応の用量―反応関係の指針263場合であっても, 忍容できる最大用量あるいは代替の指標について最大の効果を示す用量が常に至適用量であるとは限らない。単一の用量のみで試験した場合でも, 血中濃度データ（ほとんど常に薬物動態学的相違に起因するかなりの個体間変動を示すが）があれば血中濃度―反応関係について回顧的な手がかりを与えることもある。
　大規模な介入試験（例えば心筋梗塞後の予後追跡試験）では, 多くの症例数が必要なので, 単一の用量のみを用いるのが一般的であった。介入試験を計画しようとする際には, 2つ以上の用量を試験することの有益性を考慮すべきである。場合によっては, 各々の患者から集める情報を少なくすることにより試験の単純化が可能になり, 経費をそれほど増やすことなく数種の用量を用いたより大きな集団を対象とした試験が実施しうる。

3）用量―反応関係のデータが不完全であった場合の行政上の考慮
　十分に検討された計画であっても, その試験が必ずしも成功するとは限らない。他の点については十分にデザインされていた用量―反応試験が, いずれも高すぎるかあるいは互いに近過ぎる用量を用いたため, 結果として全ての用量が（プラセボよりは優れているが）同等に見えるということがありうる。その場合は, 試験した最低の用量でさえもその医薬品の最大の効果を発現させるために必要な用量よりまだ高いという可能性がある。それにもかかわらず, 観察された望ましくない効果と有益な効果のバランスが容認できれば, 試験された用量の一つをもって市販することが妥当である場合もありうる。その医薬品に特別な価値があるならば, このように判断することはもちろん容易である。しかし, そうでない場合でも, その試験で妥当な用量範囲が部分的に示されたことを考慮して, 市販後調査期間にさらに追加の用量探索を実施することを条件に受け入れることもありうる。同様に, いずれの開発計画においても用量―反応データの探索を目標とすべきではあるが, 重篤な疾患の治療あるいは予防において新たな療法の有益性が明らかである場合には, 固定した単一の用量あるいは限定された用量範囲を用いた試験から得られたデータ（しかし, 十分な用量―反応情報は含まれない）に基づいて承認することが適切である場合もありうる。

4）用量―反応情報のためのデータベース全体の吟味
　用量―反応情報を得ることを目的として特別にデザインされた試験から用量―反応情報を求めるだけでなく, データベース全体について用量依存的な効果が存在する可能性を徹底的に吟味すべきである。もちろん試験デザインの特性によっては調査に限界があることは認識すべきである。例えば, 多くの試験では安全性上の理由から用量を漸増する。医薬品の副作用のほとんどは初期の段階で出現するが, これらが治療継続中に消失することがある。このような場合, 低用量での望ましくない効果の発現率が見かけ上高くなりうる。同様に, 患者264Topic　E4 に対し期待する反応が得られるまで漸増する試験においては, 反応性があまりよくない患者に対してはさらに高用量を投与されがちである。その結果, 一見ベル型の用量―反応曲線が得られるが, これは誤解を招くものとなる。
　このような限界はあるが, たとえその分析からは主として仮説が得られるに過ぎず最終的な結論は得られないとしても, 用量に関連した共変量の影響を調べるために多変量解析あるいは他の代替法を用いてあらゆる情報源から集めた臨床データを分析すべきである。例えば, 効果と体重あるいはクレアチニンクリアランスとの間に逆相関関係があれば, それが隠された用量依存的な関係を示していることもある。もし, 薬物動態学的スクリーニングが行われたり（第Ⅱ, Ⅲ相試験の患者の大多数において定常状態の血中濃度を少数回測定する）, 他の方法により試験中に薬物の血中濃度が測定されるならば, 効果（望ましい効果あるいは望ましくない効果）と血中濃度との関係が識別できるであろう。その関係は, それ自体が血中濃度―反応についての説得力のある説明となるかもしれないし, あるいはさらなる試験の必要性を示唆する場合もあろう。

3．用量―反応を評価するための試験デザイン
1）総論
　用量―反応試験のデザインおよび試験対象母集団の選択は, 開発の段階, 治験対象としている適応症, および目的とする患者母集団における疾患の重症度に左右される。例えば, 不可逆的な結果をもたらす致死的あるいは重篤な状態に対して適切な救命療法がない場合は, 忍容される最大用量より下の用量を用いた試験を実施しなくても倫理的に問題はないであろう。均一な患者母集団であれば, 各々の治療を受ける患者が少数であっても試験の目的を達成することが一般に可能であろう。一方, 多数かつ多様な母集団の場合には, 重要になるかもしれない共変量の影響を発見することができる。
　一般に有用な用量―反応情報は, 数種の用量を比較することを目的として特別にデザインされた試験から得るのが最もよい。単一の固定用量で実施した2つあるいはそれ以上の比較対照試験の結果を比較すると, 例えばそれらの対照群が類似しているならば, 時には有益な情報が得られることもある。しかしそのような場合であっても, 異なる試験では試験間の差異が多く存在するので通常はこの方法では不十分である。固定用量の試験で得られた多様な血中濃度データから血中濃度―反応関係を回顧的に導くことが可能である場合もある。このような分析は, 疾患の重症度あるいは他の患者因子と交絡する可能性はあるものの, そこから得られる情報は有用であり, その後実施される試験の手引きとすることができる。臨床開発の初期の段階で用量―反応試験を実施することは第Ⅲ相試験での失敗を減らすことになり, 結果として医薬品開発の速度が上がり, 開発に用いる資源を節約できることになると思われる。用量―反応関係の指針265　用量―反応試験の用量を選ぶに当たって薬物動態学的情報を用いることにより, 得られる血中濃度―反応の値の適切な広がりを確保し, 得られる血中濃度の間の重複を減らす, あるいは避けることができる。薬物動態学的な変動が大きい医薬品の場合には, 用量の間隔を広くしたり, 患者数をより増やすことを選択してもよい。あるいは, 各用量群内で薬物動態学的な共変量を指標として個々の患者について調整してもよい（例えば体重, 除脂肪体重, あるいは腎機能を指標とした補正）。または, 血中濃度による比較対照試験を実施してもよい。
　実際問題として, 連続変数またはカテゴリー変数で測定される反応で治療開始後比較的速やかに発現し, かつ治療中止後比較的速やかに消失するような反応（例えば血圧, 鎮痛, 気管支拡張）の場合には, かなり容易に妥当な用量―反応データを得ることができる。この場合には, より広範な試験デザインを使用することができ, 比較的小規模で単純な試験から有用な情報を得ることができる。例えば, 医薬品の開発の初期の試験の多くで典型的に用いられるプラセボ対照をおいた各個人毎の漸増デザインは, 適正に実施および分析（母集団と個々の患者の用量―反応関係のモデルを作り, 算定する定量的な分析）されれば, より決定的な並行群間比較による固定用量の用量―反応試験を行うための手引きを得ることができるし, あるいは漸増デザイン自体で結論が出せることもあろう。
　逆に, 試験のエンドポイントや副作用が遅延して発現したり, 持続したり, あるいは不可逆であったりする場合（例えば脳卒中や心臓発作の予防, 喘息の予防, 反応の開始が遅い関節炎治療, 癌における生存, うつ病の治療）は, 通常は用量を漸増すると同時にそれに対する反応を評価するようなデザインは不可能であり, 並行群間比較による用量―反応試験が必要である。用量―反応曲線がベル型の場合, そのために有効な用量を見逃すことがあるが, 並行群間比較による用量―反応試験ではその恐れがない。ベル型曲線は, 高い用量が低い用量より有効でない場合（例えば, 作用と拮抗の混合によって起こりうる反応の場合）にみられる。
　用量―反応または血中濃度―反応関係の評価を目的とする試験は, 治療群間の比較可能性を保証するため, ならびに患者, 研究者, および分析者に起因する偏りを最小限にするために, 無作為化および（盲検化が不必要かあるいは不可能でない限り）盲検化を用いた適切な規模のよく管理された比較対照試験とすべきである。
　臨床的に意義のある差異を識別するために, 実施可能性および患者の安全性を両立できる範囲内で広い用量を選択することが重要である。用量を決めるための初期の手引きとなるような薬理学的なエンドポイントも, 妥当とみなせる代替のエンドポイントもない場合には, この点が特に重要である。

2）個々の試験デザイン
　用量―反応関係を評価するためには, 種々の試験デザインを用いることができる。同じ方法は, 血中濃度―反応関係の測定のためにも用いることができる。網羅的なリストにすることを意図してはいないが, 妥当な用量―反応情報を導くために役立つであろう方法を以下に示す。本指針に概説されているデザインの中には比較的確立されているものと, されていないものがあるが, どの方法も考慮に値するものである。これらのデザインは, 確立された臨床的エンドポイントの試験にも, あるいは代替のエンドポイントの試験にも適用できる。

1　並行群間比較用量―反応試験
	数用量の固定用量群への無作為割付け（無作為化並行群間比較用量―反応試験）は概念的に単純であり, 広く用いられ, 十分な成功を収めてきたデザインである。その場合の固定用量とは最終用量あるいは維持用量のことである。患者はすぐにその用量を投与されるか, あるいは漸増法の方がより安全と思われれば（「強制的に」漸増するスケジュールで）, その用量まで徐々に漸増される。いずれの場合も, 用量―反応の比較が可能になるように最終用量を十分な期間維持すべきである。用量―反応試験ではプラセボ群を含めることが望ましいが, 全ての場合に理論的にプラセボ群が必要というわけではない。プラセボ群がなくても, 用量―反応の正の傾きが存在すれば医薬品の有効性の証拠となる。しかしながら, 医薬品の効果の絶対的な大きさを測定するためには, 通常はプラセボあるいは目的とするエンドポイントに対して極めて限られた効果しかない比較対照薬が必要である。さらに, プラセボ群との比較により有効性が明確に示されるので, 用いた用量全てが高過ぎたために用量―反応の傾きが見られなかった試験においても, 全ての用量がプラセボより優れていることを示すことにより部分的ではあるがその試験を救うことが可能になる。原則として, 全ての群のデータを用いて用量による反応の傾向（用量が増えると反応が増すこと）が統計的に有意であることを示せるならば, 用量群間の対比較において統計的に有意な差が検出される必要はない。しかしながら, 試験された最低用量を推奨用量にしようとするときには, その用量が統計的に有意な, かつ臨床的にも意義のある効果をもつことを証明すべきである。　並行群間比較による用量―反応試験では, 群（対象母集団）の平均的な用量―反応関係が得られるが, 個々の患者の用量―反応曲線の分布あるいは形状は得られない。　並行群間比較用量―反応試験が終った時点で全ての用量が高過ぎた（用量―反応曲線のプラトー上にある）, あるいはどの用量も十分ではなかったということが判明することがよくある。正式に計画された中間解析（またはその他の多段階デザイン）を用いることにより, このような問題を発見し, 適切な用量範囲の試験を実施することが可能になると思われる。用量―反応関係の指針267　プラセボ対照をおいた試験と同様に, 一つあるいはそれ以上の実薬対照を含めた試験もまた有益であろう。プラセボ群と実薬対照群の双方を含めると「分析感度」の評価が可能になり, 群間に差が認められなかった場合に医薬品が効果をもたない場合と検出力がない（価値のない）試験であった場合との区別が可能になる。試験薬と対照薬の用量―反応曲線の比較は, まだ一般的なデザインではないが, 2つの医薬品の単一用量の比較よりも, より妥当かつ情報に富む有効性, 安全性の検討のための比較試験となるであろう。　要因試験は並行群間比較による用量―反応試験の特別な場合であり, 併用療法を評価するときに考慮すべきである。双方の医薬品が同じ反応変数に作用することを期待する場合（例えば利尿薬と他の降圧薬）, あるいはある医薬品が他方の医薬品の副作用を軽減することを期待する場合には, 要因試験が特に役立つ。これらの試験は, それぞれの成分の組合せの有効性を示すことができるばかりでなく, その医薬品を単剤で用いた場合および併用した場合の用量に関する情報も得ることができる。　要因試験は, 並行群間比較による固定用量試験であり, 各々の医薬品についてそれぞれ用量範囲を設定し, それらの用量の組合せのいくつかあるいは全てを用いる。症例数は, 対比較において単一のセルを相互に区別するに十分なほどには大きい必要はない。なぜなら, それぞれ単剤で用いた場合および併用した場合の用量―反応関係, すなわち用量―反応曲面を導くために全てのデータが使用できるからである。従って, これらの試験の規模は中規模のものとすることができる。市販にあたって承認されうる用量および用量の組合せは, 試験で実際に投与した用量そのものに限定されないが, 試験された用量あるいは組合せの範囲には含まれるものとなろう。用量を選択するにあたって反応曲面分析の結果のみには頼れない例外的な場合があろう。用量範囲の下限において, 試験に用いた用量が単剤において有効であると認められた用量よりも低いならば, 通常はその組合せの用量がプラセボより優れていることを対比較により示すことが重要である。これを示すための一つの方法は, 要因試験における最も低い用量の組合せの群およびプラセボ群の症例数を他の群より多めに設定することであり, もう一つの方法は, 別の試験でその低い用量の組合せをプラセボ群と比較することである。また, 用量範囲の上限においては, 全体の効果に対して各々の成分が寄与していることを確認する必要があろう。
2　クロスオーバー用量―反応試験
	医薬品の効果が速やかに発現し, かつ治療中止後は患者が基準値の状態にすぐに戻り, また反応が不可逆的（治癒, 死亡）でなく患者の疾患がほどよく安定しているならば, 種々の用量を用いた無作為化多時期クロスオーバー試験を有効に利用することができる。しかしながら, このデザインは全てのクロスオーバー試験に潜む問題を抱えている。すなわち, 治療中止例が多いと分析上の268Topic　E4 問題が起こりうることや個々の患者にとって試験期間が極めて長くなることがあることである。さらに, 持ち越し効果がしばしば明確でないこと（治療期間を長くすることによって持ち越し効果の問題を軽減できるだろうが）, 第1期以降の基準値の比較可能性, および時期と治療の交互作用といった問題もある。つり合い型不完備ブロック計画のように全ての患者が各々の用量の投与を受けることが必要でない方法を用いると, 試験期間の短縮が可能になる。　このデザインの利点は, いずれの個体に対しても数種類の用量が投与されるので, 母集団の平均的用量―反応曲線だけでなく個々の患者の用量―反応曲線の分布も推定できること, および並行群間比較デザインと比べて必要な患者数がおそらく少ないことである。また, 漸増デザインとは対照的に, 用量と時間の交絡がなく, かつ持ち越し効果がよりよく評価される。
3　強制的漸増試験
	全ての患者が上向きの用量の中を順次移行する強制的漸増試験では, 用量の割付けが無作為でなく順番であるということ以外は, この試験の概念およびその限界は種々の用量を用いた無作為化多時期クロスオーバー試験と類似している。ほとんどの患者が全ての用量を完了し, そして対照としてプラセボ群が並行して置かれるならば, 固定用量を用いた並行群間比較試験と正に同様に, 強制的漸増試験においても, 数種の用量を投与されて無作為割付けされた全ての群とプラセボ群との間で一連の比較が可能になる。決定的な欠点は, この試験デザインのみによっては一日当たりの投与量の増量に対する反応と, 医薬品で治療した時間が長くなったことあるいは累積の投与量が多くなったことに起因する反応とを区別できないことである。従って, 反応が遅延する場合には, 各用量での治療期間を長くしない限り不十分なデザインである。作用が発現するまでの時間が（他のデータから）短いと知られている場合であっても, 副作用の多くは時間依存的な性質を持っているので, このデザインからは副作用についての情報はほとんど得られない。　自然経過による改善の傾向は極めてありふれた出来事であり, それはプラセボ群の存在により明らかになるが, 時間の経過とともにより高い用量を用いてより高い効果を示すという余地がなくなるので, このデザインにとって問題でもある。もし累積（時間依存的な）薬効が非常に小さく, かつ治療中止例がそれほど多くないならば, このデザインによって, 母集団の平均的用量―反応および個々の患者の用量―反応関係の分布の双方についてのほどよい最初の近似値を得ることができる。並行群間比較による用量―反応試験に比べて, このデザインは用いる患者数がより少ないであろうし, 試験期間を延長すればより広い範囲の用量までの検討が可能であり, 用量反応の検討のための初期の試験として適正なデザインであろう。同時プラセボ対照群があれば, このデザインによって明らかな有効性の証拠を得ることができる。そして, 並行群間比較によ用量―反応関係の指針269る用量―反応試験における用量を選択するために特に貴重な手助けとなるだろう。
4　任意漸増試験（プラセボ対照をおきエンドポイントまで用量を漸増する試験）
	このデザインでは, プロトコールに示された投与規則に従って, 十分明確に定義された望ましい反応あるいは望ましくない反応の出現に至るまで投与量を漸増する。この方法は, 反応が適度に速やかに出現し, かつそれが脳卒中や死亡のような不可逆的な事象でない場合に最も適している。様々な用量まで漸増した患者のサブグループにおける効果を比較するといった粗雑な分析では, ほとんど反応しない症例においてのみ最大用量まで漸増されるため, しばしば誤解を招くベル型曲線が得られることがある。しかしながら, 母集団および個々の患者の用量―反応関係をモデル化して評価するような統計学的に洗練された分析方法を検討し, 補正すれば, 妥当な用量―反応情報を導くことができると思われる。このような方法で妥当な用量―反応情報を引き出した経験はまだ限られている。このデザインでは, 自然変動, 研究者の期待などを補正するために, 同時プラセボ対照群をおくことが大切である。同一の患者に数用量を用いる他のデザインと同様に, このデザインも, 同じ統計的検出力をもつ並行群間比較固定用量試験よりも必要な患者数が少ないであろうし, 母集団の平均的な用量―反応および個々の患者の用量―反応の双方に関する情報を提供できる。しかしながら, このデザインでは時間および用量の効果が交絡する危険性があり, 副作用に対する用量―反応関係の探索においては特に問題があることが予想される。強制的漸増デザインと同様に, このデザインは広範囲の用量の検討に使用可能であり, 同時プラセボ対照群をおけば, 明らかな有効性の証拠も得ることができる。また, 決定的な並行群間比較試験の用量を設定するための初期の試験として特に価値があると思われる。

4．まとめ
1）用量―反応に関するデータは, 市場に導入しようとするほとんど全ての新医薬品に関して収集されることが望ましい。これらのデータは, 信頼できかつ科学的な根拠のある試験デザインから導き出されるべきであり, 各種のデザインによって妥当な情報を得ることができる。試験は, 偏りを最小限にするために一般に認められている方法によるよく管理された比較対照試験とすべきである。本格的な用量―反応試験の実施に加え, データベース全体について用量―反応情報の存在する可能性を吟味するべきである。

2）特別に計画された試験およびデータベース全体の分析から得られた情報は下記の目的に使用されるべきである。

1	薬物動態学的および薬力学的な変動についての総合的な情報を考慮して, 適切な開始用量を見いだすこと。理想的には, 患者の体の大きさ, 性別, 年齢, 270Topic　E4 合併症, および併用療法に合わせて開始用量を調整する方法（さもなければ, 調整が必要ないと判断した確固たる根拠）も併せて見いだすのがよい。状況（疾患, 当該医薬品のもつ副作用）により, 開始用量は, 有用な効果が多少は見られる低用量から効果が最大に達する用量またはその付近の用量までの範囲内のいずれかになる。
2	患者の特性に応じて用量を適切に調整し, 反応を指標にして適正に用量を漸増する方法, および用量調整の間隔を見いだすこと。漸増の方法は, 個々の患者の用量―反応データが利用できるならば典型的な個体の用量―効果曲線（望ましい効果および望ましくない効果の双方）の形状に基づき, また, 個々の患者のデータが利用できないならば母集団の（群としての）平均的な用量―反応の形状やこれらの効果における変化を検出するために必要な時間に基づくものとなろう。母集団の（群としての）平均的な用量―反応関係を探索するための方法論は, 現時点では個々の患者の用量―反応関係を探索する方法論よりも確立されていることに注目すべきである。
3	それを超えて増量してもそれ以上有益性が見られないか, あるいは望ましくない効果が忍容できないほど増加するので, 通常は漸増を試みるべきでない用量または反応（望ましい反応あるいは望ましくない反応）を見いだすこと。

3）慎重な開発のためには, 開発の初期段階においても後期段階と同様に用量探索試験あるいは血中濃度―反応試験を実施するとよい。そうすれば, 第Ⅲ相試験が失敗したり, あるいは蓄積されたデータベースの大部分が効果のない用量または過剰用量によるデータになることを避けられる。医薬品の開発段階により試験のエンドポイントも違ってくると思われ, 例えば心不全の医薬品の試験においては, 初期には薬力学的なエンドポイント（例えば心拍出量, 楔入圧）が, その後は中間的なエンドポイント（例えば運動耐容能, 諸症状）が, 最終評価としては死亡率または不可逆的な疾患の発現率がエンドポイント（生存, 新たな梗塞）として使われることになると思われる。これらのエンドポイントに対する用量―反応関係がそれぞれ異なるかもしれないことを予期すべきである。もちろん, 承認のために何をエンドポイントとして試験すべきかは, 具体的な状況を考慮して決定される。

4）広く使われ, 成功を収め, かつ一般に受け入れられているデザインは, 3用量あるいはそれ以上の用量を並行群間比較する無作為化用量―反応試験である。そのうちの1つは用量ゼロ（プラセボ）である場合もある。しかし, このような試験が母集団の平均的用量―反応データを得るための唯一の試験デザインというわけではない。もし, 用量が適切に選択されていれば, このような試験から医薬品の用量または血中薬物濃度と, 臨床的に有益な効果または望ましくない効果との間の関係を明らかにすることができる。
　用量は数用量必要であり, プラセボに加えて少なくとも2用量は必要である。用量―反応関係の指針271しかし, 一般に2用量よりも多くの用量を用いた試験が望ましい。試験薬の単一の用量とプラセボとの比較では, 試験薬とプラセボの間に差がないという帰無仮説の検定が可能であるが, 用量―反応関係を明らかにすることはできない。同様に, 実薬の2用量（プラセボなし）に対する反応から直線関係を導いたとしても, 通常はこのような近似からは十分な情報は得られない。通常は, 試験デザインは用量―反応の関数関係の解明を強調すべきであり, 個々の対比較を強調すべきではない。もしも, ある特定の低い用量が有用かどうかというような曲線上の特定の一点が問題であるならば, それについては別途試験すべきである。

5）有益な効果および望ましくない効果の双方に関する用量―反応データに含まれる情報によって, 適切なベネフィットとリスクの比を考慮した上での用量範囲の承認が可能になる。十分な比較対照をおいた用量―反応試験は, 有効性の主要な証拠の提示にも役立つことになる。

6）各国の規制当局および医薬品の開発に従事する者は, 用量―反応データの研究において, 既存のあるいは将来のデータベースに対する合理的かつ文書で十分に証明された探索的データ解析のような新しい方法および概念を受け入れるべきである。各国の当局は, ベイズ法, ポピュレーション法, モデルを用いた方法, および薬物動態―薬力学的方法のような多様な統計学的および計量薬物学的手法の使用を受け入れるべきである。しかしながら, このような方法があるとしても, 前向きの無作為化した複数の用量水準を用いた臨床試験から用量―反応データを得る必要性が無にされるものではない。他の目的に適合するように作られたデータベースから用量―反応情報を探索して事後的な探索的データ解析を行うと, しばしば新しい仮説が生まれるであろう。しかし, 用量―反応関係について決定的な評価ができることはごくまれである。
　回顧的なポピュレーション型の分析の利用が増加しているが, それを含む多様なデータ分析手法, および新しいデザイン（例えば逐次デザイン）は, 用量―反応関係を明らかにするために役立つと思われる。例えば用量を体重あたりの用量に計算し直したり, 腎機能, 除脂肪体重などによって用量を補正したりすると, 固定用量デザインを連続した用量水準として再分析することができる。同様に, 用量―反応試験中に血中濃度を測定していれば, 血中濃度―反応関係の推定が可能になるであろう。服薬規定の遵守に関する信頼できる情報に基づいて, 医薬品の投与量が補正されることもある。これらの場合のいずれにおいても, 交絡が存在すること, すなわち再計算した用量および反応の双方を変化させる因子, あるいは血中濃度および反応, 服薬規定の遵守および反応などの双方を変化させる因子が存在することは常に意識しておくべきである。

7）用量―反応データに, 年齢, 性別, または人種のような人口統計学的な特性に基づいた部分集合による差異があるかどうかを探索すべきである。そのた272Topic　E4 めには, これらの群の間に薬物動態学的差異, 例えば, 代謝の違いに起因する差異, 体型または体質の差異などが存在するかどうかを知ることが重要である。
8）承認の可否は医薬品についての情報全体の考察に基づいてなされる。用量―反応情報は利用可能であるべきだが, 示された有効性の種類や程度によっては承認後に引き続き試験を実施するとの条件のもとにデータベースの不備が容認されることもある。例えば特殊な母集団における反応の情報, 長期使用における情報, 薬剤間あるいは薬物―疾患相互作用の可能性に関する情報のような有益な情報を与える用量―反応データが期待される。しかし, 非常に優れた治療上の有益性がある場合, 緊急に必要な場合, あるいは観察された副作用が極めて低レベルである場合には, それらを考慮して用量―反応データの要求は後に満たされればよいこともありうる。

「新医薬品の承認に必要な用量―反応関係の検討のための指針」Q&A

Q1．本指針の位置づけを明らかにしていただきたい。

　通知前文でも述べたように, 本指針は, 平成4年6月に公表された「新医薬品の臨床評価に関する一般指針」における用量反応試験に関する記述内容を補完するものである。しかしながら, 本指針では, 従来行われている「至適用量幅の決定のための用量設定試験」という考え方に留まらず, 医薬品の開発期間全般にわたり必要な用量反応情報を収集し, その後の治験, 及び市販後の当該医薬品の使用に対して有益な情報を提供するために考慮すべき方法論について指針を示すものである。
　本指針では, 個々の患者において医薬品を安全かつ有効に使用するために役立つ情報を提供するとの考え方に基づき, 下記の情報が必要であるとしている。

(1)	適切な開始用量
(2)	特定の患者の必要性に合わせて用量を調整するための情報（集団として, 又は個体ごとの用量変更のための情報）
(3)	それ以上の増量をあきらめて, 他の治療に切り替えるための情報

Q2．全ての医薬品について用量―反応情報の収集が必要であるのか。

　基本的には全ての医薬品について用量―反応情報を収集し, 当該医薬品の用量―反応関係について検討すべきである。有意な用量―反応関係が示されれば, その治験薬が実際に薬効を有することの証明になるとともに, 治療を行う上での有益な情報が得られるからである。
　しかし, 疾患により作用の用量依存性を求めることが困難な場合がある。このような場合には, 仮に用量依存性があるならば, 実施した治験において十分な例数を使用しているからそれが見出されるはずである旨を説明し, さらにどのような根拠から臨床推奨用量を設定したかを説明する必要があろう。

Q3．推奨用量を決定する際には一般的にどのようなことを考慮すべきか。

　推奨用量は, 望ましい作用と望ましくない作用の用量―反応関係を推定した上で, 治療上の必要性を考慮し, 両者のバランスを考えて許容できる用量範囲を選ぶべきである。従って, 望ましくない作用における用量―反応情報も重要なものとなる。これら二者の関係は薬剤のもつ性質により異なる。典型的な関係を図1A及びBに示した。
　図1Aは望ましい作用と望ましくない作用の用量―反応曲線が大きく離れており, 高用量を推奨用量とすることが可能で, 個体差も考慮すると広い用量幅274Topic　E4 を選ぶことができる。また, あえて低い用量の検討の必要はない。図1Bにおいては安全域が狭く, 推奨用量の幅は狭くなる。このような薬剤は重篤な疾患に用いるのであれば, 安全性が許容できる範囲内で, できるだけ高用量を推奨することになる。
図1

Q4．用量―反応関係を求めることが困難な場合には, どのように考えたらよいのか。

　用量―反応関係を示すことが困難な状況は種々想定される。例えば, 用量―反応曲線の傾きが極めて急又は緩徐な場合, 安全への配慮のために高用量が投与できない場合, 有効性上の理由で低用量が用いられない場合, 長期大規模試験により真のエンドポイントで有効性, 安全性を評価する場合などである。
　このような場合には, 用量―反応関係を検討する上で, 治験デザインが十分であったか否かを吟味する必要がある。
　用量―反応関係が示されない場合, 薬効分野によっては当該医薬品の有効性の有無が明らかでない場合がある。そのような薬剤の有効性を証明するには, プラセボとの比較が必要であろう。一方で, 用量―反応関係が明瞭でなくても, 治療上の必要性によっては新薬の存在意義があるとみなせる分野もある。

Q5．指針中で述べられている「母集団の平均的用量―反応関係」と「個々の患者の用量―反応関係」の区別と, それらの間の関係について説明していただきたい。

　用量―反応関係に関しては, 各個体別（個々の患者ごと）に求められる用量―反応関係, 各個体の要因別サブグループでの平均的用量―反応関係, そして母集団としての平均的用量―反応関係などがある。
　通常, 個体内の用量―反応曲線, サブグループの用量―反応曲線, 母集団の平均的用量―反応曲線は同じではない。すなわち, 母集団の用量―反応情報は個体の用量―反応情報を推測する際の参考とはなるが, その情報を各個体の用量―反応情報として直接的に利用することは適切ではない。本指針においては, 今まであまり考えられていなかった個体内の用量―反応情報を得るための各種デザインについて, その利点・欠点が詳細に議論されており, それが本指針の特徴の一つと言えよう。

Q6．本ガイドラインの中の「データベース」という用語はどのような概念であるのか, 説明していただきたい。

　データベースとは情報処理の用語で, 一定の目的のもとに集められた多くの試験のデータ又は特定の試験のデータを指す。本ガイドラインにおけるデータベースは, 1つの試験のデータということではなく, 当該治験薬の試験に関連する全てのデータの集りを指している。臨床推奨用量は, 用量―反応試験の結果のみから定めるのではなく, 全ての試験の結果を併せて吟味して定める必要があり, このような考察の対象となるデータの集りを意味する。
　さらに, 「データベースの不備」という表現もあるが, これは集積されたデータの質や量に不備があるということではなく, データベースからは用量依存性が示されなかったことを意味している。

Q7．用量―反応の検討と血中濃度―反応の検討との関係はどのように考えたらよいのか。

　本指針にもあるように, 全ての医薬品について血中濃度―反応関係を求める必要はない。しかし, 血中濃度―反応関係が用量―反応関係の検討に役立つ場合がある。
　用量と反応の関係は, 用量と体内動態の関係及び体内動態と反応の関係に分解しうる。同一の用量を用いた場合でも, 吸収, 分布, 代謝, 排泄などの各過程の相違により薬物動態学的な変動を生じる。また, 動態が類似したものであっても, 反応性の相違により薬力学的な変動が生じる。従って, 血中濃度―反応関係の分析も重要である。
　また, 薬物動態に関する情報, 血中濃度―反応関係の情報を十分に整えてお276Topic　E4 けば, TDM（Thetapeutic Drug Monitoring）などに利用することも可能である。この際, 薬物動態スクリーニングを用いれば, 各対象からは少数回の採血を行うだけで十分な情報が得られる。

Q8．用量―反応関係の検討における試験期間の設定の考え方を教えていただきたい。

　薬剤の作用の程度（強度）は, 吸収された薬剤の作用発現部位における組織内濃度に依存することが多いが, 作用の発現時期は組織内濃度に加えて, ある一定以上の濃度が維持されている時間にも依存したり, 遅延反応であったりということもある。対象となる疾患, 薬剤の特性などによって異なるが, 作用によってはそれが最大となるまでに, かなりの時間が必要な場合もある。また, 望ましい作用と望ましくない作用の発現時間が異なる場合も考えられる。本指針の「所定の用量における試験期間は, 最大の効果が発現するのに十分な長さ」という記述は, 血中濃度が平衡に達した状態だけでは短い場合もあることを考慮して理解していただきたい。
図2

Q9．用量―反応関係の検討は開発のどの段階で実施すべきか。

　従来は, 前期第Ⅱ相試験で用量の瀬踏みをして, 後期第Ⅱ相試験で「用量設定試験」を実施するという画一的な方法が採られていた。本指針ではそのような考え方を改め, 開発の初期から後期までいずれの段階, 相においても, 各段階, 相それぞれに適した方法で, 用量―反応情報を収集すべきことが強調されている。偏りのない用量―反応試験の結果は最終的には医薬品開発の失敗を防ぐ（正しい判断を導く）ものである。どのような情報をどの時点で把握して, その結果を次の段階, 相にどのように反映させて行くのかが重要である。
　一般的には, 初期では広い用量を設定し, 用量間の幅も比較的大きくした上で, 大まかな用量範囲探索試験（dose-ranging study）を行い, 比較的低用量から高用量までの用量―反応曲線（可能ならばこれ以上の効果の増強が期待できない用量近辺まで含め）を求める。この求められた結果から, さらに詳細な情報を得るための用量―反応試験の実施を考える。このように, 望ましい作用と望ましくない作用のバランスを考える上で, よりよい用量が求められるような範囲を設定し, 臨床試験をデザインすることが必要である。

Q10．用量―反応情報を得るための試験を計画する上で基本的に考慮すべき点は何か。

　いろいろな治験デザインからそのデザインに応じた用量―反応情報が得られるが, もっとも有用な用量―反応情報は, 数種の用量を無作為割付けして比較する前向き比較対照試験から得られることが多い。薬効評価の偏りを避けるためには, （盲検化が困難もしくは不可能でない限り）二重盲検法を用い, 設定した目的に対応した結論が得られる十分な検出力をもった比較対照試験とすべきである。
　また, 用量―反応試験のデザインを具体的に考えるときに考慮すべき事柄としては, 疾患の性質, 指標とする反応の性質, 患者（母集団）の特性, 標準的な治療の有無, 治験薬の特性などがある。

Q11．用量―反応試験の用量はどのように選んだらよいのか。

　用量―反応試験を失敗しないためには, 比較する用量の選び方が重要である。選択した用量が結果的にいずれも高すぎたり, 低すぎたりしたために, 明瞭な用量―反応関係が認められない事例が多く存在する。そのためには, 類薬や非臨床試験の結果を参考とするとともに, 探索段階で幅広く多様な情報を集めることが基本である。さらに, 本指針では用量の選択にあたって, 次のような考え方が示唆されている。

(1)広い用量を選択する。
	実施可能性及び被験者の安全性の確保が両立する範囲内で, できるだけ広く278Topic　E4用量を選択する。探索段階で幅広く多様な情報を集めることが基本である。
(2)薬物動態学的情報を利用する。
	薬物の血中濃度―反応関係が示されれば, 目的とする反応を得るために必要となる用量を推定することができる。

Q12．並行群間比較による用量―反応試験で, 実薬対照を含めた試験の意義はどこにあるのか。

　適切な試験に基づき薬効の評価が定まっている実薬を用量―反応試験に含めると, さらに有用な情報が得られることもある。指針の中では, 「群間に差が認められなかった場合に医薬品が効果をもたない場合と検出力がない（価値のない）試験であった場合との区別が可能になる」とある。その実対照薬の用量が1つであっても, 望ましい効果の程度が治験薬の用量―反応曲線のどの位置にあるかを検討することにより, 目的を達成することが可能となる。
　さらに, 複数用量の実薬対照群を含め, 用量―反応曲線を別々に求め比較することも可能であろう。このような治験デザインは, 非臨床試験ではよく用いられるが, 臨床試験ではいまだ一般的ではなく, 経験は限られている。しかし, このような試験から得られる情報は大変に有用である。

Q13．用量反応試験結果の解析に際し, 用量群間の対比較は必要であるのか。

　用量―反応試験の目的によって, 統計的に検証すべき仮説が変わる点に注意が必要である。傾向性の検定のみで十分な場合もあるし, プラセボと実薬群の比較と実薬群間の用量依存性の検討の2つが目的となる場合もある。薬効分野や薬剤の性格に応じた仮説を検討すべきであり, やみくもに対比較を行うべきではない。また, 多重性の調整も異なる推論の領域では不必要であり, 検定の構造に応じた多重性の調整を行うべきである。
　ここで, プラセボ, 低用量, 中用量, 高用量の有効率の比較から用量―反応関係を議論する場合を例として挙げる（図3）。対比較の場合を図3Aに示した。対比較を用いて用量―反応関係を議論するには, プラセボと低用量, プラセボと中用量, プラセボと高用量の比較を適切な多重性の調整を前提として実施することが多い。ここで, いずれかの対比較において有意差が認められれば, その用量はプラセボと有効率が異なると結論することができる。
　傾向性検定の場合を図3Bに示した。ここでは各用量ごとの有効率に直線をあてはめ, その傾きが正であるか否かを検定する。その結果が有意であるなら, 有効率は用量依存的に上昇すると結論することができる。ここで, 傾向性の検討にあたってプラセボ群を含めて検定するか否かは注意を要し, 治験の目的との関連の上で決定すべきである。傾向性検定が有意となった場合, これは薬効の存在を証明する結果となる。
図3