Introduction to PROscorer

Ray Baser

2021-06-05

概観

PROscorer パッケージは、研究でよく使われる特定の患者報告アウトカム(PRO)、生活の質(QoL)、その他の心理測定尺度や質問票ベースの尺度を採点するための関数の拡張可能なレポジトリです。

(注:ここからは、わかりやすくするために、これらの種類の尺度を総称して、やや不正確に「PRO 測定」、「PRO 類似測定」、または単に「PROs」と呼ぶことにします)。

国際生活の質学会(ISOQOL)のタスクフォースによる最近の取り組みでは、PRO 測定の報告、分析、プロトコル記述の標準化を目指しています。 しかし、PRO を採点するためのベストプラクティス・ガイダンスや標準化されたソフトウェアは存在しません。 PROscorer プロジェクトは、一般的に使用されている PRO のスコアリングと文書化を標準化するシステムを提供することで、PRO のスコアリングのベストプラクティスを確立することを目的としています。 重要なのは、 PROscorer Rパッケージは、PRO の採点を科学的に再現可能なワークフローに統合することも容易にすることである。

PROscorer パッケージの各関数は、異なるPRO測定を採点します。 関数は PRO 尺度の頭文字を用いて命名されます。 例えば、fsfi 関数は Female Sexual Function Index (FSFI) を採点します。

また、PROscorer には、PROscorer が採点する各指標の詳細な説明を含む vignette が付属しています(CRAN の main PROscorerページを参照)。 参考文献を含むこれらの機器の説明を含む目的は、プロトコル、助成金、および発表された結果における PRO 測定の説明を改善するのに役立つことです。 ほとんどの場合、これらの記述は、ほとんどあるいは全く編集することなく、研究文書に使用することができます。

スコアリングエラーやその他のバグの可能性を最小限にするために、各 PROscorer 関数は、PROscorerTools パッケージからの、より単純でよくテストされた「ヘルパー」関数で構成されている。 徹底的にテストされたシンプルな関数の小さなセットに依存することで、PROscorer 関数の基本的なコードベースにバグがなく、採点関数が信頼性の高い、一貫した正確な結果を出すことができます。

PROscorer は、PROscorerTools パッケージとともに、科学的に厳密で再現性のある方法で研究や臨床の場にPRO測定値を組み込むことを容易にするシステムです。 PROscorer および PROscorerTools パッケージの包括的な目標は、PROの採点および報告のベストプラクティスに注目し、一般的に使用される PRO 測定の採点手順を標準化することで、不正確で一貫性のない採点を排除することである。

問題

科学的厳密さと再現性は、他の研究分野に比べ、PRO、QoL および類似の尺度を用いた研究は遅れています。

これらの欠点の3つの主な理由は、(1)誤った採点手順によって引き起こされる測定誤差、(2)同じ PRO 測定を使用する異なる研究間での採点指示の一貫しない適用、(3)研究プロトコルやそのような測定を組み込んだ研究の発表結果における PRO 類似測定の不十分、不完全、不正確な記述です。

スコアリング手順は、PRO や類似の尺度に依存する研究におけるエラーの主要な原因となります。

これらのエラーは通常、気づかれず、隠され、無視され、研究の科学的完全性を損ない、これらの尺度を使用する研究を実施する多くの科学分野の進歩を妨げます。

同様に、PRO 採点手順の一貫性のない適用や研究ごとの採点のばらつきは、研究結果の再現性を低下させ、 PRO 測定からの信頼できる科学的データの蓄積を遅らせます。

研究文書における PRO 類似尺度の不十分、不完全、不正確な記述は、混乱を引き起こし、研究プロセスの複数の段階で誤り、見落とし、その他のミスを引き起こす可能性があります。

解決への提案

PROscorer パッケージは、PRO 類似測定を含む研究におけるこれらの問題に対処するための標準化されたフレームワークを提供するものです。

PROscorer パッケージの高い目標は、研究や臨床の場で一般的に使用されている PRO 類似測定のスコアリング構文と機器の説明のゴールドスタンダードなオープンソースリポジトリとしての役割を果たすことで、PRO ベースの研究におけるこれらの深刻な欠陥をなくすことです。

PROscorer パッケージの機能とそれを支えるインフラは、この野心的な目標を念頭に置いて慎重に計画されています。

主な機能の概要

インストールと使用

CRAN から PROscorer の安定バージョンをインストール:

install.packages("PROscorer")

次のようにして、PROscorer をRのワークスペースにロードします。:

library(PROscorer)

例として、PROscorerToolsパッケージのmakeFakeData関数を使用して、EORTC QLQ-C30 生活の質に関する質問票の偽の項目回答を作成します。 作成されたデータセット(“dat” という名前)には、“id” 変数と、20人の架空の回答者による30項目(“q1”、“q” などという名前)への回答があります。 また、欠落している回答(「NA」)も散見されます。

dat <- PROscorerTools::makeFakeData(n = 20, nitems = 30, values = 1:4, id = TRUE)
dat

以下では、qlq_c30 関数を使って、“dat” にある偽の回答を採点します。 EORTC QLQ-C30 質問票のスコアを “c30scores” というデータフレームに保存します。

c30scores <- qlq_c30(dat, 'q')
c30scores

qlq_c30 の最初の引数には、データフレームの “dat” が渡されます。 2番目の引数では、qlq_c30 関数に “dat” の中のアイテムをどのように見つけるかを伝える必要がありました。 私たちのアイテムはすべて “q” という接頭辞とアイテム番号で名付けられているので、この引用された接頭辞を第2引数に与えました。 これらの引数には実際に名前がありますが、ほとんどの場合、名前を明示的に使用する必要はありません。 以下では、同じ結果が得られますが、引数の名前を明示的に使用しています。

c30scores <- qlq_c30(df = dat, iprefix = 'q')
c30scores

具体的には、1つ目の引数はdfdata frame の略)、2つ目の引数は iprefixitem prefixの略)と名付けられています。

スコアをアイテムの回答と一緒にメインのデータフレームに戻したい場合は、いくつかの方法があります。 例えば、datdat_scored の順序を変更していないと仮定すると、以下のようになります。

dat_scored <- data.frame(dat, c30scores)
dat_scored

関数 qlq_c30 の詳細については,Rで ?qlq_c30 と入力して,その「ヘルプ」ページにアクセスすることができます。

将来の開発計画

R パッケージの PROscorer ファミリーには、PROscorerPROscorerTools、および FACTscorer があります。 PROscorer の開発に関して、私の優先事項は以下の通りです。

  1. PROscorer を拡張し、特定のPROのためのスコアリング機能を増やす。 EORTCの機器のいくつかは私のリストの上位にあります。

  2. 機能をどのようにプログラムすべきか、舞台裏の基準をさらに改善し、PROscorer に独自の PRO スコアリング機能をプログラムして貢献したいと考えているユーザーのためのガイドを書く。

  3. ユーザーが PROscorerTools を使用して自分の好きなPROのための採点関数を書き、PROscorer に含めるためにそれらを提出することができる共同インフラストラクチャ(例えば GitHub 上)を完成させる。 この主要な構成要素は、スコアリング関数を書くためのステップバイステップのガイド、機器の説明を書くためのガイドライン、関数のドキュメントを書くためのテンプレートなど、いくつかのインストラクション・ヴィネットを作成することである。

  4. PROscorer および PROscorerTools のユニットテストフレームワークをより包括的にする。 8つの関数の基礎となるコードのほとんどは、すでに PROscorerTools のテストによってテストされているだろう。 しかし、採点関数にユニットテストを追加することを容易にするために、PROscorer 関数のためのテストの標準的なセットを考え出す予定です。

  5. PRO の採点方法とベストプラクティスに関する教育的な小冊子を書く。

  6. IRT ベースのスコアを生成する機能を、そのスコアリング方法を使用する PRO に追加します。 私は、様々な PROMIS 測定を使用している多くの研究者を知っています。 彼らは IRT ベースの採点法を使いたいと思っているが、研究のワークフローに組み込むのが難しすぎると感じています。 PROscorer を使えば、より多くの研究者がIRTベースのスコアにアクセスできるようになります。

より詳しい情報のためのリソース