• ние

Валидиране на модел за извличане на данни спрямо традиционни методи за оценка на зъбната възраст сред корейски юноши и млади възрастни

Благодарим ви, че посетихте Nature.com.Версията на браузъра, който използвате, има ограничена поддръжка на CSS.За най-добри резултати препоръчваме да използвате по-нова версия на вашия браузър (или да изключите режима на съвместимост в Internet Explorer).Междувременно, за да осигурим постоянна поддръжка, ние показваме сайта без стилове или JavaScript.
Зъбите се считат за най-точния индикатор за възрастта на човешкото тяло и често се използват при криминалистична оценка на възрастта.Имахме за цел да валидираме оценките на зъбната възраст, базирани на извличане на данни, като сравняваме точността на оценката и ефективността на класификацията на 18-годишния праг с традиционни методи и оценки на възрастта, базирани на извличане на данни.Бяха събрани общо 2657 панорамни радиографии от корейски и японски граждани на възраст от 15 до 23 години.Те бяха разделени на комплект за обучение, всеки от които съдържаше 900 корейски радиографии, и набор за вътрешни тестове, съдържащ 857 японски рентгенографии.Сравнихме точността на класификацията и ефективността на традиционните методи с тестови набори от модели за извличане на данни.Точността на традиционния метод върху набора от вътрешни тестове е малко по-висока от тази на модела за извличане на данни и разликата е малка (средна абсолютна грешка <0,21 години, средна квадратична грешка <0,24 години).Ефективността на класификацията за 18-годишното прекъсване също е сходна между традиционните методи и моделите за извличане на данни.По този начин традиционните методи могат да бъдат заменени от модели за извличане на данни, когато се извършва криминалистична оценка на възрастта, като се използва зрелостта на втория и третия молар при корейски юноши и млади възрастни.
Оценката на възрастта на зъбите се използва широко в съдебната медицина и детската стоматология.По-специално, поради високата корелация между хронологичната възраст и денталното развитие, оценката на възрастта по етапи на дентално развитие е важен критерий за оценка на възрастта на децата и юношите 1,2,3.При младите хора обаче определянето на възрастта на зъбите въз основа на зрелостта на зъбите има своите ограничения, тъй като растежът на зъбите е почти завършен, с изключение на третите молари.Правната цел на определянето на възрастта на младежите и юношите е да се предоставят точни оценки и научни доказателства за това дали те са навършили пълнолетие.В медико-правната практика на юноши и млади възрастни в Корея, възрастта е оценена с помощта на метода на Лий и е предвиден законов праг от 18 години въз основа на данните, докладвани от Oh et al 5 .
Машинното обучение е вид изкуствен интелект (AI), който многократно учи и класифицира големи количества данни, решава проблеми самостоятелно и управлява програмирането на данни.Машинното обучение може да открие полезни скрити модели в големи обеми данни6.Обратно, класическите методи, които са трудоемки и отнемат много време, могат да имат ограничения, когато работят с големи обеми сложни данни, които са трудни за ръчна обработка7.Ето защо напоследък са проведени много проучвания с помощта на най-новите компютърни технологии за минимизиране на човешките грешки и ефективна обработка на многоизмерни данни8,9,10,11,12.По-специално, дълбокото обучение се използва широко в анализа на медицински изображения и се съобщава, че различни методи за оценка на възрастта чрез автоматично анализиране на радиографии подобряват точността и ефективността на оценката на възрастта13,14,15,16,17,18,19,20 .Например, Halabi et al 13 разработиха алгоритъм за машинно обучение, базиран на конволюционни невронни мрежи (CNN) за оценка на възрастта на скелета, използвайки радиографии на детски ръце.Това проучване предлага модел, който прилага машинно обучение към медицински изображения и показва, че тези методи могат да подобрят диагностичната точност.Li et al14 оценяват възрастта от рентгенови изображения на таза, използвайки дълбоко обучение CNN и ги сравняват с регресионни резултати, използвайки оценка на етапа на осификация.Те откриха, че моделът на CNN за задълбочено обучение показва същото представяне на възрастовата оценка като традиционния регресионен модел.Проучването на Guo et al. [15] оценява ефективността на класификацията на възрастовата толерантност на CNN технологията въз основа на зъбни ортофотоснимки и резултатите от модела на CNN доказват, че хората превъзхождат ефективността на възрастовата класификация.
Повечето проучвания за определяне на възрастта с помощта на машинно обучение използват методи за дълбоко обучение13,14,15,16,17,18,19,20.Съобщава се, че оценката на възрастта, базирана на дълбоко обучение, е по-точна от традиционните методи.Този подход обаче предоставя малко възможности за представяне на научната основа за оценките на възрастта, като например възрастовите показатели, използвани в оценките.Има и съдебен спор кой извършва проверките.Следователно оценката на възрастта въз основа на дълбоко обучение е трудна за приемане от административните и съдебните органи.Извличането на данни (DM) е техника, която може да открие не само очаквана, но и неочаквана информация като метод за откриване на полезни корелации между големи количества данни6,21,22.Машинното обучение често се използва в извличането на данни и както извличането на данни, така и машинното обучение използват едни и същи ключови алгоритми за откриване на модели в данните.Оценката на възрастта с помощта на денталното развитие се основава на оценката на лекаря за зрелостта на целевите зъби и тази оценка се изразява като етап за всеки целеви зъб.DM може да се използва за анализиране на връзката между етапа на оценка на зъбите и действителната възраст и има потенциала да замени традиционния статистически анализ.Следователно, ако приложим DM техники за оценка на възрастта, можем да внедрим машинно обучение в криминалистична оценка на възрастта, без да се тревожим за правна отговорност.Публикувани са няколко сравнителни проучвания за възможните алтернативи на традиционните ръчни методи, използвани в съдебната практика и базираните на EBM методи за определяне на зъбната възраст.Shen et al23 показаха, че DM моделът е по-точен от традиционната формула на Camerer.Galibourg et al24 прилагат различни методи на DM за прогнозиране на възрастта според критерия на Demirdjian25 и резултатите показват, че методът на DM превъзхожда методите на Demirdjian и Willems при оценката на възрастта на френското население.
За да се оцени възрастта на зъбите на корейски юноши и млади хора, методът 4 на Лий се използва широко в корейската съдебномедицинска практика.Този метод използва традиционен статистически анализ (като множествена регресия), за да изследва връзката между корейските субекти и хронологичната възраст.В това проучване методите за оценка на възрастта, получени с помощта на традиционни статистически методи, се определят като „традиционни методи“.Методът на Lee е традиционен метод и неговата точност е потвърдена от Oh et al.5;Въпреки това, приложимостта на оценката на възрастта въз основа на модела DM в корейската съдебна практика все още е под въпрос.Нашата цел беше научно да потвърдим потенциалната полезност на оценката на възрастта въз основа на DM модела.Целта на това проучване беше (1) да се сравни точността на два модела на DM при оценката на зъбната възраст и (2) да се сравни ефективността на класификацията на 7 модела на DM на възраст 18 години с тези, получени с помощта на традиционни статистически методи. и трети кътници на двете челюсти.
Средните стойности и стандартните отклонения на хронологичната възраст по етап и тип зъб са показани онлайн в допълнителна таблица S1 (набор за обучение), допълнителна таблица S2 (набор за вътрешни тестове) и допълнителна таблица S3 (набор за външни тестове).Капа стойностите за интра- и междунаблюдателна надеждност, получени от набора за обучение, бяха съответно 0,951 и 0,947.P стойностите и 95% доверителни интервали за капа стойностите са показани в онлайн допълнителна таблица S4.Капа стойността се тълкува като „почти перфектна“, в съответствие с критериите на Landis и Koch26.
При сравняване на средната абсолютна грешка (MAE), традиционният метод леко превъзхожда модела DM за всички полове и във външния мъжки тестов набор, с изключение на многослойния персептрон (MLP).Разликата между традиционния модел и модела DM на вътрешния набор от тестове MAE беше 0,12–0,19 години за мъжете и 0,17–0,21 години за жените.За външната тестова батерия разликите са по-малки (0,001–0,05 години за мъжете и 0,05–0,09 години за жените).В допълнение, средната квадратична грешка (RMSE) е малко по-ниска от традиционния метод, с по-малки разлики (0,17–0,24, 0,2–0,24 за набор от вътрешни тестове за мъже и 0,03–0,07, 0,04–0,08 за набор от външни тестове).).MLP показва малко по-добра производителност от Single Layer Perceptron (SLP), освен в случая на женския външен тестов комплект.За MAE и RMSE наборът от външни тестове дава по-високи резултати от набора от вътрешни тестове за всички полове и модели.Всички MAE и RMSE са показани в таблица 1 и фигура 1.
MAE и RMSE на традиционни и регресионни модели за извличане на данни.Средна абсолютна грешка MAE, средна квадратична грешка RMSE, еднослоен персептрон SLP, многослоен перцептрон MLP, традиционен CM метод.
Ефективността на класификацията (с прекъсване от 18 години) на традиционните и DM моделите беше демонстрирана по отношение на чувствителност, специфичност, положителна прогнозна стойност (PPV), отрицателна прогнозна стойност (NPV) и площ под кривата на работната характеристика на приемника (AUROC) 27 (Таблица 2, Фигура 2 и Допълнителна Фигура 1 онлайн).По отношение на чувствителността на вътрешната тестова батерия традиционните методи се представят най-добре сред мъжете и по-лошо сред жените.Въпреки това, разликата в ефективността на класификацията между традиционните методи и SD е 9,7% за мъжете (MLP) и само 2,4% за жените (XGBoost).Сред моделите на DM, логистичната регресия (LR) показа по-добра чувствителност и при двата пола.По отношение на спецификата на набора от вътрешни тестове беше отбелязано, че четирите SD модела се представят добре при мъже, докато традиционният модел се представя по-добре при жени.Разликите в ефективността на класификацията за мъже и жени са съответно 13,3% (MLP) и 13,1% (MLP), което показва, че разликата в ефективността на класификацията между моделите надвишава чувствителността.Сред моделите DM моделите на опорната векторна машина (SVM), дървото на решенията (DT) и произволната гора (RF) се представят най-добре сред мъжете, докато моделът LR се представя най-добре сред жените.AUROC на традиционния модел и всички SD модели е по-голям от 0,925 (k-най-близкия съсед (KNN) при мъжете), демонстрирайки отлична класификационна производителност при разграничаване на 18-годишни проби28.За набора от външни тестове е налице намаление в ефективността на класификацията по отношение на чувствителност, специфичност и AUROC в сравнение с набора от вътрешни тестове.Освен това разликата в чувствителността и специфичността между ефективността на класификацията на най-добрите и най-лошите модели варира от 10% до 25% и е по-голяма от разликата във вътрешния набор от тестове.
Чувствителност и специфичност на моделите за класификация на извличане на данни в сравнение с традиционните методи с граница от 18 години.KNN k най-близък съсед, SVM поддържаща векторна машина, LR логистична регресия, DT дърво на решенията, RF произволна гора, XGB XGBoost, MLP многослоен перцептрон, традиционен CM метод.
Първата стъпка в това проучване беше да се сравни точността на оценките на зъбната възраст, получени от седем DM модела с тези, получени с помощта на традиционна регресия.MAE и RMSE бяха оценени във вътрешни набори от тестове за двата пола и разликата между традиционния метод и DM модела варираше от 44 до 77 дни за MAE и от 62 до 88 дни за RMSE.Въпреки че традиционният метод е малко по-точен в това проучване, трудно е да се заключи дали такава малка разлика има клинично или практическо значение.Тези резултати показват, че точността на оценката на зъбната възраст с помощта на DM модела е почти същата като тази на традиционния метод.Директното сравнение с резултатите от предишни проучвания е трудно, тъй като нито едно проучване не е сравнявало точността на моделите на DM с традиционните статистически методи, използвайки същата техника за записване на зъби в същия възрастов диапазон, както в това проучване.Galibourg et al24 сравняват MAE и RMSE между два традиционни метода (метод на Demirjian25 и метод на Willems29) и 10 модела на DM във френско население на възраст от 2 до 24 години.Те съобщават, че всички модели на DM са по-точни от традиционните методи, с разлики от 0,20 и 0,38 години в MAE и 0,25 и 0,47 години в RMSE в сравнение с методите на Willems и Demirdjian, съответно.Несъответствието между SD модела и традиционните методи, показани в проучването на Халибург, взема предвид многобройни доклади30,31,32,33, че методът на Demirdjian не оценява точно зъбната възраст в популации, различни от френските канадци, на които се основава проучването.в това проучване.Tai et al 34 използваха алгоритъма MLP, за да предвидят възрастта на зъбите от 1636 китайски ортодонтски снимки и сравниха неговата точност с резултатите от метода на Demirjian и Willems.Те съобщават, че MLP има по-висока точност от традиционните методи.Разликата между метода на Демирджиан и традиционния метод е <0,32 години, а методът на Вилемс е 0,28 години, което е подобно на резултатите от настоящото изследване.Резултатите от тези предишни проучвания24,34 също са в съответствие с резултатите от настоящото проучване и точността на оценката на възрастта на модела на DM и традиционния метод са сходни.Въпреки това, въз основа на представените резултати, можем само предпазливо да заключим, че използването на DM модели за оценка на възрастта може да замени съществуващите методи поради липсата на сравнителни и референтни предишни проучвания.Необходими са последващи проучвания с използване на по-големи проби, за да се потвърдят резултатите, получени в това проучване.
Сред проучванията, тестващи точността на SD при определяне на зъбната възраст, някои показаха по-висока точност от нашето проучване.Stepanovsky et al 35 приложиха 22 SD модела към панорамни рентгенографии на 976 чешки жители на възраст от 2,7 до 20,5 години и тестваха точността на всеки модел.Те оцениха развитието на общо 16 горни и долни леви постоянни зъба, използвайки критериите за класификация, предложени от Moorrees et al 36 .MAE варира от 0,64 до 0,94 години, а RMSE варира от 0,85 до 1,27 години, които са по-точни от двата DM модела, използвани в това проучване.Shen et al23 използваха метода Cameriere, за да оценят зъбната възраст на седем постоянни зъба в лявата долна челюст при жители на източен Китай на възраст от 5 до 13 години и го сравниха с възрастта, изчислена с помощта на линейна регресия, SVM и RF.Те показаха, че и трите модела DM имат по-висока точност в сравнение с традиционната формула на Cameriere.MAE и RMSE в проучването на Shen са по-ниски от тези в модела DM в това проучване.Повишената прецизност на изследванията на Stepanovsky et al.35 и Shen et al.23 може да се дължи на включването на по-млади субекти в техните извадки за изследване.Тъй като оценките за възрастта на участниците с развиващи се зъби стават по-точни с увеличаването на броя на зъбите по време на зъбното развитие, точността на получения метод за оценка на възрастта може да бъде компрометирана, когато участниците в проучването са по-млади.Освен това грешката на MLP в оценката на възрастта е малко по-малка от тази на SLP, което означава, че MLP е по-точен от SLP.MLP се счита за малко по-добър за оценка на възрастта, вероятно поради скритите слоеве в MLP38.Има обаче изключение за външната извадка от жени (SLP 1.45, MLP 1.49).Констатацията, че MLP е по-точна от SLP при оценката на възрастта, изисква допълнителни ретроспективни проучвания.
Класификационната ефективност на модела DM и традиционния метод на 18-годишен праг също беше сравнена.Всички тествани SD модели и традиционните методи на вътрешния набор от тестове показаха практически приемливи нива на дискриминация за 18-годишната извадка.Чувствителността за мъже и жени е съответно над 87,7% и 94,9%, а специфичността е по-голяма от 89,3% и 84,7%.AUROC на всички тествани модели също надхвърля 0,925.Доколкото ни е известно, нито едно проучване не е тествало ефективността на модела DM за 18-годишна класификация въз основа на зрялост на зъбите.Можем да сравним резултатите от това проучване с ефективността на класификацията на моделите за дълбоко обучение върху панорамни радиографии.Guo et al.15 изчислиха ефективността на класификацията на базиран на CNN модел за дълбоко обучение и ръчен метод, базиран на метода на Demirjian за определен възрастов праг.Чувствителността и специфичността на ръчния метод са съответно 87,7% и 95,5%, а чувствителността и специфичността на CNN модела надхвърлят съответно 89,2% и 86,6%.Те заключиха, че моделите на задълбочено обучение могат да заменят или да надминат ръчната оценка при класифицирането на възрастовите прагове.Резултатите от това проучване показаха подобна класификация;Смята се, че класификацията с помощта на DM модели може да замени традиционните статистически методи за оценка на възрастта.Сред моделите DM LR беше най-добрият модел по отношение на чувствителността за мъжката проба и чувствителността и специфичността за женската проба.LR е на второ място по специфичност при мъжете.Освен това LR се счита за един от по-лесните за употреба модели DM35 и е по-малко сложен и труден за обработка.Въз основа на тези резултати, LR се счита за най-добрия модел за класифициране на границата за 18-годишните в корейското население.
Като цяло, точността на оценката на възрастта или изпълнението на класификацията на набора от външни тестове е лоша или по-ниска в сравнение с резултатите от набора от вътрешни тестове.Някои доклади показват, че точността или ефективността на класификацията намалява, когато оценките за възрастта, базирани на корейското население, се прилагат към японското население 5, 39, и подобен модел беше открит в настоящото проучване.Тази тенденция на влошаване се наблюдава и в модела DM.Следователно, за да се оцени точно възрастта, дори когато се използва DM в процеса на анализ, трябва да се предпочитат методите, получени от данни за местното население, като традиционни методи 5,39,40,41,42.Тъй като не е ясно дали моделите за задълбочено обучение могат да покажат подобни тенденции, са необходими проучвания, сравняващи точността и ефективността на класификацията с помощта на традиционни методи, DM модели и модели за задълбочено обучение върху едни и същи проби, за да се потвърди дали изкуственият интелект може да преодолее тези расови различия в ограничена възраст.оценки.
Ние демонстрираме, че традиционните методи могат да бъдат заменени от оценка на възрастта въз основа на модела DM в съдебната практика за оценка на възрастта в Корея.Открихме и възможността за внедряване на машинно обучение за криминалистична оценка на възрастта.Съществуват обаче ясни ограничения, като например недостатъчния брой участници в това проучване, за да се определят окончателно резултатите, и липсата на предишни проучвания за сравняване и потвърждаване на резултатите от това проучване.В бъдеще проучванията на DM трябва да се провеждат с по-голям брой проби и по-разнообразни популации, за да се подобри практическата му приложимост в сравнение с традиционните методи.За да се потвърди осъществимостта на използването на изкуствен интелект за оценка на възрастта в множество популации, са необходими бъдещи проучвания за сравняване на точността на класификацията и ефективността на моделите на DM и задълбочено обучение с традиционните методи в същите проби.
Проучването използва 2657 ортографски снимки, събрани от възрастни корейци и японци на възраст от 15 до 23 години.Корейските рентгенографии бяха разделени на 900 комплекта за обучение (19,42 ± 2,65 години) и 900 набора за вътрешни тестове (19,52 ± 2,59 години).Наборът за обучение беше събран в една институция (Болница Св. Мария в Сеул), а собственият набор от тестове беше събран в две институции (Зъболекарска болница на Националния университет в Сеул и Стоматологична болница на университета Йонсей).Също така събрахме 857 радиографии от други данни, базирани на населението (Медицински университет Ивате, Япония) за външно тестване.Рентгенографии на японски субекти (19,31 ± 2,60 години) бяха избрани като набор от външни тестове.Данните бяха събрани ретроспективно, за да се анализират етапите на развитие на зъбите върху панорамни рентгенографии, направени по време на стоматологично лечение.Всички събрани данни бяха анонимни, с изключение на пола, датата на раждане и датата на рентгенографията.Критериите за включване и изключване бяха същите като предишните публикувани проучвания 4, 5.Действителната възраст на пробата се изчислява чрез изваждане на датата на раждане от датата, на която е направена рентгеновата снимка.Извадката беше разделена на девет възрастови групи.Разпределението по възраст и пол е показано в таблица 3. Това проучване е проведено в съответствие с Декларацията от Хелзинки и е одобрено от Институционалния съвет за преглед (IRB) на болницата "Света Мария" в Сеул на Корейския католически университет (KC22WISI0328).Поради ретроспективния дизайн на това проучване не може да се получи информирано съгласие от всички пациенти, подложени на радиографско изследване за терапевтични цели.Болницата St. Mary на университета в Сеул (IRB) се отказа от изискването за информирано съгласие.
Етапите на развитие на бимаксиларните втори и трети молари бяха оценени съгласно критериите на Demircan25.Избран е само един зъб, ако същият тип зъб е намерен от лявата и дясната страна на всяка челюст.Ако хомоложните зъби от двете страни са били на различни етапи на развитие, зъбът с по-нисък етап на развитие е избран, за да се отчете несигурността в изчислената възраст.Сто произволно избрани рентгенографии от набора за обучение бяха оценени от двама опитни наблюдатели, за да се тества надеждността между наблюдателите след предварително калибриране, за да се определи етапът на зрялост на зъбите.Интранаблюдателната надеждност беше оценена два пъти на тримесечни интервали от първичния наблюдател.
Полът и етапът на развитие на втория и третия молар на всяка челюст в набора за обучение бяха оценени от първичен наблюдател, обучен с различни DM модели, и действителната възраст беше зададена като целева стойност.SLP и MLP моделите, които се използват широко в машинното обучение, бяха тествани срещу регресионни алгоритми.DM моделът комбинира линейни функции, използвайки етапите на развитие на четирите зъба и комбинира тези данни, за да оцени възрастта.SLP е най-простата невронна мрежа и не съдържа скрити слоеве.SLP работи на базата на прагово предаване между възлите.Моделът SLP в регресията е математически подобен на множествената линейна регресия.За разлика от модела SLP, моделът MLP има множество скрити слоеве с нелинейни функции за активиране.Нашите експерименти използваха скрит слой само с 20 скрити възли с нелинейни функции за активиране.Използвайте градиентно спускане като метод за оптимизация и MAE и RMSE като функция на загубата, за да обучите нашия модел за машинно обучение.Най-добрият получен регресионен модел беше приложен към вътрешните и външните тестови комплекти и беше оценена възрастта на зъбите.
Разработен е класификационен алгоритъм, който използва зрелостта на четири зъба в набора за обучение, за да предскаже дали дадена проба е на 18 години или не.За да изградим модела, извлечехме седем алгоритъма за машинно обучение6,43 на представяне: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBoost и (7) MLP .LR е един от най-широко използваните класификационни алгоритми44.Това е алгоритъм за контролирано обучение, който използва регресия, за да предвиди вероятността данните да принадлежат към определена категория от 0 до 1 и класифицира данните като принадлежащи към по-вероятна категория въз основа на тази вероятност;използва се главно за двоична класификация.KNN е един от най-простите алгоритми за машинно обучение45.Когато му бъдат дадени нови входни данни, той намира k данни, близки до съществуващия набор и след това ги класифицира в класа с най-висока честота.Зададохме 3 за броя на разглежданите съседи (k).SVM е алгоритъм, който максимизира разстоянието между два класа чрез използване на функция на ядрото за разширяване на линейното пространство в нелинейно пространство, наречено fields46.За този модел използваме отклонение = 1, мощност = 1 и гама = 1 като хиперпараметри за ядрото на полинома.DT се прилага в различни области като алгоритъм за разделяне на цял набор от данни на няколко подгрупи чрез представяне на правила за вземане на решения в дървовидна структура47.Моделът е конфигуриран с минимален брой записи на възел от 2 и използва индекса Gini като мярка за качество.RF е метод на ансамбъл, който комбинира множество DTs за подобряване на производителността, като използва метод за агрегиране на първоначално зареждане, който генерира слаб класификатор за всяка проба чрез произволно изтегляне на проби от същия размер многократно от оригиналния набор от данни48.Използвахме 100 дървета, 10 дълбочини на дърветата, 1 минимален размер на възела и индекс на примеси Gini като критерии за разделяне на възли.Класификацията на новите данни се определя с мнозинство на гласовете.XGBoost е алгоритъм, който комбинира техники за повишаване, използвайки метод, който приема като данни за обучение грешката между действителните и прогнозираните стойности на предишния модел и увеличава грешката с помощта на градиенти49.Това е широко използван алгоритъм поради добрата си производителност и ефективност на ресурсите, както и висока надеждност като функция за корекция на прекомерното оборудване.Моделът е оборудван с 400 опорни колела.MLP е невронна мрежа, в която един или повече перцептрони образуват множество слоеве с един или повече скрити слоеве между входния и изходния слой38.Използвайки това, можете да извършите нелинейна класификация, при която, когато добавите входен слой и получите резултатна стойност, предвидената резултатна стойност се сравнява с действителната резултатна стойност и грешката се разпространява обратно.Създадохме скрит слой с 20 скрити неврона във всеки слой.Всеки модел, който разработихме, беше приложен към вътрешни и външни набори за тестване на ефективността на класификацията чрез изчисляване на чувствителност, специфичност, PPV, NPV и AUROC.Чувствителността се определя като съотношението на проба, оценена на възраст 18 години или повече, към проба, оценена на възраст 18 години или повече.Специфичността е съотношението на пробите под 18-годишна възраст и тези, за които се предполага, че са под 18-годишна възраст.
Стоматологичните етапи, оценени в набора за обучение, бяха преобразувани в числени етапи за статистически анализ.Извършена е многовариантна линейна и логистична регресия, за да се разработят прогнозни модели за всеки пол и да се изведат регресионни формули, които могат да се използват за оценка на възрастта.Използвахме тези формули, за да оценим възрастта на зъбите както за вътрешни, така и за външни набори от тестове.Таблица 4 показва моделите на регресия и класификация, използвани в това изследване.
Интра- и междунаблюдателната надеждност беше изчислена с помощта на капа статистиката на Коен.За да тестваме точността на DM и традиционните регресионни модели, ние изчислихме MAE и RMSE, използвайки изчислената и действителната възраст на вътрешните и външните набори от тестове.Тези грешки обикновено се използват за оценка на точността на прогнозите на модела.Колкото по-малка е грешката, толкова по-висока е точността на прогнозата24.Сравнете MAE и RMSE на вътрешни и външни набори от тестове, изчислени с помощта на DM и традиционна регресия.Ефективността на класификацията на 18-годишната граница в традиционната статистика беше оценена с помощта на таблица за непредвидени обстоятелства 2 × 2.Изчислената чувствителност, специфичност, PPV, NPV и AUROC на тестовия набор бяха сравнени с измерените стойности на модела за класификация на DM.Данните се изразяват като средно ± стандартно отклонение или число (%) в зависимост от характеристиките на данните.Двустранните P стойности <0,05 се считат за статистически значими.Всички рутинни статистически анализи бяха извършени с помощта на SAS версия 9.4 (SAS Institute, Cary, NC).DM регресионният модел е внедрен в Python с помощта на Keras50 2.2.4 бекенд и Tensorflow51 1.8.0 специално за математически операции.Класификационният модел на DM беше внедрен в средата за анализ на знанията Waikato и платформата за анализ Konstanz Information Miner (KNIME) 4.6.152.
Авторите признават, че данните в подкрепа на заключенията на изследването могат да бъдат намерени в статията и допълнителните материали.Наборите от данни, генерирани и/или анализирани по време на проучването, са достъпни от съответния автор при разумно искане.
Ritz-Timme, S. et al.Оценка на възрастта: най-модерното, за да отговори на специфичните изисквания на криминалистичната практика.интернационалност.Й. Правна медицина.113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G. и Olze, A. Текущо състояние на криминалистичната оценка на възрастта на живи субекти за целите на наказателното преследване.Криминалистика.лекарство.Патология.1, 239–246 (2005).
Pan, J. et al.Модифициран метод за оценка на зъбната възраст на деца на възраст от 5 до 16 години в източен Китай.клинични.Устна анкета.25, 3463–3474 (2021).
Lee, SS и др. Хронология на развитието на втори и трети молари при корейците и нейното приложение за съдебна оценка на възрастта.интернационалност.Й. Правна медицина.124, 659–665 (2010).
Oh, S., Kumagai, A., Kim, SY и Lee, SS. Точност на оценката на възрастта и оценката на 18-годишния праг въз основа на зрелостта на втория и третия молар при корейци и японци.PLoS ONE 17, e0271247 (2022).
Kim, JY и др.Предоперативният анализ на данни, базиран на машинно обучение, може да предвиди резултата от лечението на хирургия на съня при пациенти с OSA.науката.Доклад 11, 14911 (2021).
Хан, М. и др.Точна оценка на възрастта от машинно обучение с или без човешка намеса?интернационалност.Й. Правна медицина.136, 821–831 (2022).
Хан, С. и Шахин, М. От извличане на данни към извличане на данни.J. Информация.науката.https://doi.org/10.1177/01655515211030872 (2021).
Хан, С. и Шахин, М. WisRule: Първият когнитивен алгоритъм за извличане на асоциативни правила.J. Информация.науката.https://doi.org/10.1177/01655515221108695 (2022).
Шахин М. и Абдула У. Карм: Традиционно извличане на данни, базирано на контекстно базирани правила за асоцииране.изчисли.Мат.продължи.68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. и Habib M. Откриване на семантично сходство, базирано на задълбочено обучение, използвайки текстови данни.информирам.технологии.контрол.https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Табиш, М., Таноли, З. и Шахин, М. Система за разпознаване на дейност в спортни видеоклипове.мултимедия.Приложения за инструменти https://doi.org/10.1007/s11042-021-10519-6 (2021).
Halabi, SS и др.RSNA Machine Learning Challenge в педиатричната костна възраст.Радиология 290, 498–503 (2019).
Li, Y. et al.Криминалистична оценка на възрастта от рентгенови лъчи на таза с помощта на дълбоко обучение.ЕВРО.радиация.29, 2322–2329 (2019).
Guo, YC, et al.Точна възрастова класификация с помощта на ръчни методи и дълбоки конволюционни невронни мрежи от ортографски проекционни изображения.интернационалност.Й. Правна медицина.135, 1589–1597 (2021).
Алабама Далора и др.Оценка на костната възраст с помощта на различни методи за машинно обучение: систематичен преглед на литературата и мета-анализ.PLoS ONE 14, e0220242 (2019).
Du, H., Li, G., Cheng, K. и Yang, J. Оценка на възрастта на афро-американци и китайци, базирана на обема на пулпната камера на първите кътници, използвайки компютърна томография с конусен лъч.интернационалност.Й. Правна медицина.136, 811–819 (2022).
Kim S., Lee YH, Noh YK, Park FK и Oh KS Определяне на възрастови групи на живи хора с помощта на базирани на изкуствен интелект изображения на първите кътници.науката.Доклад 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N. и Urschler, M. Автоматична оценка на възрастта и възрастова класификация на мнозинството от многовариантни MRI данни.IEEE J. Biomed.Сигнали за здравето.23, 1392–1403 (2019).
Cheng, Q., Ge, Z., Du, H. и Li, G. Оценка на възрастта въз основа на 3D сегментиране на пулпна камера на първи молари от компютърна томография с конусен лъч чрез интегриране на дълбоко обучение и набори от нива.интернационалност.Й. Правна медицина.135, 365–373 (2021).
Wu, WT, et al.Извличане на данни в клинични големи данни: общи бази данни, стъпки и модели на методи.Свят.лекарство.ресурс.8, 44 (2021).
Yang, J. et al.Въведение в медицинските бази данни и технологиите за извличане на данни в ерата на големите данни.J. Avid.Основна медицина.13, 57–69 (2020).
Shen, S. et al.Методът на Camerer за определяне на възрастта на зъбите с помощта на машинно обучение.BMC Oral Health 21, 641 (2021).
Galliburg A. и др.Сравнение на различни методи за машинно обучение за прогнозиране на зъбната възраст с помощта на метода на Demirdjian.интернационалност.Й. Правна медицина.135, 665–675 (2021).
Demirdjian, A., Goldstein, H. и Tanner, JM Нова система за оценка на зъбната възраст.изсумтявам.биология.45, 211–227 (1973).
Landis, JR и Koch, GG Мерки за съгласие на наблюдателя по категорични данни.Биометрия 33, 159–174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK и Choi HK.Текстурен, морфологичен и статистически анализ на двуизмерно магнитно резонансно изображение с помощта на техники за изкуствен интелект за диференциране на първични мозъчни тумори.Здравна информация.ресурс.https://doi.org/10.4258/hir.2022.28.1.46 (2022).


Време на публикуване: 04 януари 2024 г