Autoregressive Moving Average Mit Exogenen Variablen


Autoregressive mit exogenen Variablen und neuronalen Netzwerk Kurzzeit-Lastprognose Modelle für Wohn-Niederspannungs-Verteilungsnetze Wenn Sie eine Korrektur anfordern, erwähnen Sie bitte diese Elemente behandeln: Repec: gam: jeners: v: 7: y: 2014: i: 5: p: 2938-2960: d: 35652. Siehe allgemeine Informationen zur Korrektur von Material in RePEc. Wenn Sie diesen Artikel verfasst haben und noch nicht bei RePEc registriert sind, empfehlen wir Ihnen, dies hier zu tun. Für technische Fragen zu diesem Artikel oder zur Korrektur der Autoren, Titel, Zusammenfassung, Bibliographie oder Download-Informationen wenden Sie sich bitte an: (XML Conversion Team) . Dadurch können Sie Ihr Profil mit diesem Element verknüpfen. Es erlaubt Ihnen auch, potenzielle Zitate zu diesem Punkt zu akzeptieren, dass wir uns unsicher sind. Wenn Referenzen vollständig fehlen, können Sie sie über dieses Formular hinzufügen. Wenn die vollständigen Referenzen ein Element auflisten, das in RePEc vorhanden ist, aber das System nicht mit ihm verknüpft ist, können Sie mit diesem Formular helfen. Wenn Sie über fehlende Elemente wissen, können Sie uns helfen, diese Links zu erstellen, indem Sie die entsprechenden Referenzen in der gleichen Weise wie oben hinzufügen. Wenn Sie ein registrierter Autor dieses Artikels sind, können Sie auch die Registerkarte Zitate in Ihrem Profil überprüfen, da es einige Zitate gibt, die auf die Bestätigung warten. Bitte beachten Sie, dass Korrekturen einige Wochen dauern können, um die verschiedenen RePEc-Dienste zu filtern. Mehr Leistungen Folgen Serien, Zeitschriften, Autoren amp mehr Neue Papiere per E-Mail Neuzugänge zu RePEc abonnieren Autor-Registrierung Öffentliche Profile für Wirtschaftswissenschaftler Verschiedene Rankings der Forschung in Wirtschaftswissenschaften amp verwandte Bereiche Wer war ein Student von wem, mit RePEc RePEc Biblio Kuratierte Artikel amp Papiere zu verschiedenen Themen der Wirtschaftswissenschaften Hochladen Sie Ihr Papier auf RePEc und IDEAS aufgeführt werden EconAcademics Blog Aggregator für Ökonomie Forschung Plagiat Fälle von Plagiaten in der Wirtschaft Job-Marktpapiere RePEc Arbeitspapier-Serie für den Arbeitsmarkt Fantasy League Vortäuschen Sie sind an der Spitze einer Volkswirtschaft Abteilung Dienstleistungen aus dem StL Fed Data, Forschung, Anwendungen amp mehr aus der St. Louis FedDemand für Gesundheitsdienste hat sich nicht nachhaltig 1. 2. Dies ist vor allem auf die Zunahme der Bevölkerung und der Lebenserwartung, der Eskalationskosten, der erhöhten Patientenerwartungen und der Belegschaft zurückzuführen. Trotz erhöhter Anforderungen ist die Zahl der stationären Betten in Krankenhäusern seit dem letzten Jahrzehnt um 2 gesunken. Ein effizientes Bettenmanagement ist der Schlüssel zur Erfüllung dieser steigenden Nachfrage und der Senkung der Kosten im Gesundheitswesen. Die tägliche Ausstoßrate kann ein potentieller Echtzeitindikator für die betriebliche Effizienz sein 5. Aus einer Stationsebene Sicht, eine gute Schätzung der nächsten Tage Entladungen ermöglichen Krankenhauspersonal, mögliche Probleme wie Änderungen in der Anzahl der verfügbaren Betten und Änderungen in der Anzahl der erforderlichen Mitarbeiter vorzusehen. Effiziente Prognose reduziert Bett Krise und verbessert die Ressourcenzuteilung. Diese Vorhersage kann dazu beitragen, die Entlassungsvorbereitung zu beschleunigen, was enorme Kosten für das klinische Personal und die Aufklärung von Patienten und Angehörigen zur Folge hat. 6. 7. Allerdings bietet das Studium Patientenfluss aus allgemeinen Bezirken mehrere Herausforderungen. Ward-Ebene Entladungen enthalten weit größeren Krankenhausdynamik, die oft nichtlineare 8. Der Zugang zu klinischen Informationen in Echtzeit kann aufgrund administrativer und prozeduraler Barrieren schwierig sein, diese Daten sind möglicherweise nicht für prädiktive Anwendungen verfügbar. Da die Diagnosekodierung nach der Entladung durchgeführt wird, gibt es wenig Informationen über den medizinischen Zustand oder die Variation der Pflegequalität in Echtzeit. Darüber hinaus spielen andere Faktoren als der Patientenzustand eine Rolle bei den Entlassungsentscheidungen 5. 9. 10. Die gegenwärtige Praxis der Bettverteilung in den allgemeinsten Bezirken der meisten Krankenhäuser schließt ein Krankenhauspersonal ein, das frühere Informationen und Erfahrung benutzt, um Zeitplan und zuweisen Betten 11. Moderne maschinelle Lerntechniken können verwendet werden, um solche Entscheidungen zu unterstützen und helfen, den zugrunde liegenden Prozess zu verstehen. Als Beispiel veranschaulicht Fig. 1 einen Entscheidungsbaum, der auf vergangenen Entladungen trainiert ist, und von Belegungsstatistiken, die das tägliche Entladungsmuster von einer offenen Station in einem regionalen australischen Krankenhaus modellieren. Obwohl die Abwesenheit von Patienten medizinischen Informationen betroffen Prognose Leistung, die Entscheidungsregeln bieten wichtige Einblick in die Entlastung Prozess. Motiviert durch dieses Ergebnis, adressieren wir das offene Problem der Prognose tägliche Entladungen aus einer Station mit keine Echtzeit-klinischen Daten. Im Einzelnen vergleichen wir die Prognoseleistung von 5 populären Regressionsmodellen: (1) der klassische autoregressive integrierte gleitende Durchschnitt (ARIMA), (2) der autoregressive gleitende Durchschnitt mit exogenen Variablen (ARMAX), (3) k-nächster Nachbar (kNN) Regression, (4) Random Forest (RF) Regression und (v) Unterstützung Vektor Regression (SVR). Unsere Experimente wurden auf allgemein verfügbaren Daten von einer Erholungsstation (Heideflügel 5) in Barwon Health, einem regionalen Krankenhaus in Victoria, Australien, durchgeführt. Die Modelle ARIMA und kNN werden aus täglichen Entladungen gebaut. Um den saisonalen Charakter der Einleitungen zu berücksichtigen, umfaßte das ARMAX-Modell den Wochentag und die Belegungsstatistik. Wir identifizierten und konstruierten 20 Station-Ebene und 88 Patienten-Ebene Prädiktoren zur Ableitung der RF-und SVR-Modelle. Die Prognosegenauigkeit wurde unter Verwendung von 3 Metriken auf einem gehaltenen Satz von 2511 Patientenbesuchen im Jahr 2014 gemessen. Im Vergleich zu einer naiven Prognosemethode zur Verwendung des Mittelwerts der vergangenen Wochen zeigen wir durch unsere Experimente, dass (1) mit Regressionsmethoden für (2) SVR - und HF-Modelle übertreffen die autoregressiven Methoden und kNN, (3) ein HF-Modell, das aus 108 Merkmalen abgeleitet ist, hat den minimalen Fehler für die Prognosen des nächsten Tages. Die Bedeutung unserer Studie ist es, die Bedeutung der Vorhersage der verfügbaren Betten in den Stationen zu identifizieren, die dazu beitragen könnten, den Notzugriffsblock 12 zu entlasten. Patient Länge des Aufenthalts direkt zu Krankenhauskosten und Ressourcenallokation beiträgt. Langfristige Prognosen im Gesundheitswesen zielen darauf ab, Betten - und Personalbedarf über einen Zeitraum von Monaten bis Jahren zu modellieren. Cote und Tucker kategorisieren die gemeinsamen Methoden im Gesundheitswesen Nachfrage Prognose als Prozentanpassung, 12-Monats-gleitenden Durchschnitt, Trendlinie und saisonale Prognose 13. Obwohl jede dieser Methoden aus der historischen Nachfrage aufgebaut ist, liefert die saisonale Prognose realistischere Ergebnisse, da sie die saisonalen Schwankungen und Trends der Daten berücksichtigt. Mackay und Lee 3 beraten die Modellierung des Patientenflusses in Einrichtungen des Gesundheitswesens für taktische und strategische Prognosen. Zu diesem Zweck wurden die Kompartimentmodelle 14, 15, die Warteschlangenmodelle 16, 17 und die Simulationsmodelle 17 bis 20 zur Analyse des Patientenflusses angewandt. Um den langfristigen Patientenfluss zu verstehen, analysieren Studien Metriken wie Bettenbelegung 3. 8. 14. 19. 21. 22, Patientenankünfte 23 und individuelle Patientenverweildauer 19. 24 - 27. Auf der anderen Seite setzt unsere Arbeit kurzfristige Prognosen ein. Die kurzfristigen Prognosemethoden befassen sich mit stündlichen und täglichen Prognosen aus einer Einheit in einem Pflegeumfeld. Die am meisten verbreitete Einheit ist die Notfall - oder Akutmedizinische Abteilung, da dies häufig eine wichtige Kennzahl für die Beurteilung der Versorgungsqualität ist. Entscheidungsbaum Modellierung der Gesamtentladungen aus einer offenen Station von Tag der Woche und Belegung (vorige Tag Besetzung) Daten für 5 Jahre. Die Blätter stellen die Gesamtzahl der Patientenentladungen dar. Zeitreihen und Glättungsmethoden Beim Betrachten von Entladungen als Zeitreihen sind autoregressive gleitende Durchschnittsmodelle die beliebtesten 30 - 32. Exponentielle Glättungstechniken wurden ebenfalls verwendet, um die monatlichen 33 und täglichen Patientenströme 34 zu prognostizieren. Jones und andere verwendeten die klassische ARIMA prognostiziert tägliche Bettbelegung in Notaufnahme eines europäischen Krankenhauses 30. Das Modell, das saisonale Bedingungen enthielt, zeigte eine vernünftige Leistung, um die Bettenbelegung vorherzusagen. Die Autoren spekulierten, ob nicht-lineare Prognosetechniken über ARIMA verbessern könnten. Eine aktuelle Studie bestätigte die Wirksamkeit dieser Prognosetechnik in einer US-Krankenhaus-Einstellung 35. ARIMA-Modelle wurden auch erfolgreich zur Prognose der Anzahl der besetzten Betten während eines SARS-Ausbruchs in einem Krankenhaus in Singapur 36 verwendet. In einer kürzlich durchgeführten Studie wurden Patientendiensten in einer pädiatrischen Notfallabteilung eingesetzt, um den täglichen Bedarf mit ARIMA 37 zu modellieren. Jones et al 34 verglichen die ARIMA-Modus mit exponentiellen Glättung und künstliche neuronale Netze prognostiziert täglich Patientenvolumen in Notfall-Abteilung. Die Studie ergab, dass kein einziges Modell überlegen war und schloss, dass saisonale Muster eine große Rolle in der täglichen Nachfrage spielen. Die Modellierung mittels Simulation wird typischerweise verwendet, um das Verhalten komplexer Systeme zu untersuchen. Eine frühe Arbeit untersuchte die Auswirkungen der Notaufnahme auf tägliche Betten Anforderungen in der Akutversorgung, mit diskreten Ereignis stochastische Simulation Modellierung 38. Sinreich und Marmor 39 schlugen einen Leitfaden für den Aufbau eines Simulationswerkzeugs auf der Grundlage von Daten aus Notabteilungen von 5 israelischen Krankenhäusern vor. Ihre Methode analysiert den Fluss der Patienten in 8 Arten zusammen mit Zeit-Elemente gruppiert. Die Simulation zeigte, dass die Patientenprozesse besser durch die Art der Patienten charakterisiert werden, als durch spezielle Krankenhäuser. Yeh und Lin verwendeten ein Simulationsmodell zur Charakterisierung des Patientenflusses durch eine Krankenhaus-Notfallabteilung und reduzierte Wartezeiten unter Verwendung eines genetischen Algorithmus 40. Ein ähnlicher Versuch wurde in einer geriatrischen Abteilung unter Verwendung einer Kombination aus diskreter Ereignissimulation und Warteschlangenmodell durchgeführt, um die Bettenbelegung zu analysieren. Regression für Forecasting Regressionsmodelle analysieren die Beziehung zwischen der prognostizierten Variablen und den Merkmalen in den Daten. Eine lineare Regression, die monatliche Variationen kodierte, wurde verwendet, um Patienteneintritte über einen 6-Monatshorizont zu prognostizieren und übertrafen quadratische und autoregressive Modelle 41. Eine weitere Studie verwendet Clustering und Principle Component Analysis PCA, um signifikante Prädiktoren aus Patientendaten zu Modell Notfall Länge des Aufenthalts mit linearen Regression 42 zu finden. Ein nichtlinearer Ansatz unter Verwendung von Regressionsbäumen wurde in der Prognose von Patienteneinträgen vorgeschlagen, die eine überlegene Leistungsfähigkeit gegenüber einem neuronalen Netzraument zeigen. Barnes et al verwendeten 10 Prädiktoren zur Modellierung der intravenösen Aufenthaltsdauer in einer 36-Betten-Einheit unter Verwendung eines HF-Modells 24. Die nichtlineare Regression ist besser geeignet, die sich verändernde Dynamik des Patientenflusses zu modellieren. Um den Abfluss von Patienten aus der Station zu charakterisieren, greifen wir auf Regression mit RF, kNN und SVR zurück. Im Bereich der Mustererkennung sind kNNs 44 die effektivste Methode, die wiederholte Muster ausnutzt. Der kNN-Algorithmus wurde erfolgreich zur Prognose auf Histogramm-Zeitreihen in den Finanzdaten 45 angewendet. Die nichtparametrische Regression unter Verwendung von kNN wurde erfolgreich für die kurzfristige Verkehrsprognose 46 gezeigt. 47 und die Stromlastvorhersage 48. 49. Jedoch wurde die kNN-Regression nicht für den Patientenfluss untersucht. Eine weitere leistungsfähige und populäre Regressionstechnik, SVR, verwendet Kernelfunktionen, um Funktionen in einen höherdimensionalen Raum abzubilden, um eine lineare Regression durchzuführen. Obwohl diese Technik nicht viel Anwendung in der medizinischen Prognose gesehen hat, haben Support-Vektor-Maschinen erfolgreich in der Finanzmarkt-Vorhersage, Stromvorhersage, Business-Prognose und Zuverlässigkeit Vorhersage 50. Neben den üblichen autoregressiven Methoden verwenden wir kNN, RFs und SVR bei der Vorhersage der Entladungen am nächsten Tag. Da sich Entladungsmuster im Laufe der Zeit wiederholen, kann die kNN-Regression angewendet werden, um nach einem passenden Muster aus vergangenen Entladungen zu suchen. RFs und SVR-Regression sind leistungsfähige Modellierungstechniken, die eine minimale Abstimmung erfordern, um die Nichtlinearität in den Krankenhausprozessen effektiv zu behandeln. Vor kurzem wurde eine HF-Prognose verwendet, um die Gesamtentleerung eines Patienten aus einer 36-Bett-Einheit in einem städtischen Krankenhaus 24 vorherzusagen. Diese Studie verwendete neben 4 demographischen und 2 zeitlichen Vorhersagen drei klinische Prädiktoren für Patienten: (1) Anlass zur Besichtigung: von einem Arzt identifiziert und unter Verwendung der Internationalen Klassifikation der Krankheiten: Version 9 (ICD-9) Diagnosecodes 51, (2 ) Beobachtungsstatus: Patienten zugeordnet für die Überwachung Zweck, und (3) bis zur Entlastung Ort. Die Gesamtzahl der Einleitungen wurde aus der Gesamtheit der individuellen Patientenaufenthalte geschätzt. Das Fehlen von Echtzeit-klinischen Informationen in unseren Daten macht die Berechnung der Patienten Länge des Aufenthalts unmöglich. Stattdessen greifen wir auf die Modellierung der Entladungen am nächsten Tag zurück, indem wir vorherige Entladungsmuster beobachten und die demographischen und fliessenden Eigenschaften in der Station untersuchen. Unsere Studie verwendet retrospektive Daten gesammelt aus einer Erholungsstation in Barwon Health, einem großen öffentlichen Gesundheits-Anbieter in Victoria, Australien mit etwa 350.000 Einwohner. Ethik Genehmigung wurde von der Hospital und Research Ethics Committee bei Barwon Health (Nummer 1283) und Deakin University erhalten. Die Gesamtzahl der verfügbaren Betten hängt von der Anzahl der Mitarbeiter ab, die der Station zugeordnet sind. Im Durchschnitt hatte die Station 36 Betten, aber schwankte zwischen 20 und 80 Betten mit unterschiedlichem Patientenfluss. Die Ärzte in der Gemeinde hatten keine Lehrverantwortung. Tabellen in der Krankenhaus-Datenbank verwendet in unserer Datenerhebung. Ein IQR, interquartile Bereich. Die Daten für unsere Studie kamen aus drei Tabellen in der Krankenhaus-Datenbank, wie in Tabelle 1 gezeigt. Zusätzliche Echtzeit-Daten, die Patientenkondition oder Krankheitsprogression beschrieben wurden nicht verfügbar, da Diagnose-Codierung mit medizinischen Codes nach Entladung erfolgt. Der Patientendurchfluss wurde für einen Zeitraum von 4 Jahren gesammelt. Unter Verwendung der Eintritts - und Entladezeiten für jeden Patienten, berechneten wir die täglichen Entladungen aus unserer Station in der Studie. Insgesamt wurden 12.141 Patienten mit einer medianen Entlassung von 8 Patienten pro Tag vom 1. Januar 2010 bis zum 31. Dezember 2014 in die Station aufgenommen. Tabelle 2 fasst die Hauptmerkmale unserer Daten zusammen. Eine Zeitreihenzerlegung unserer Daten zeigte starke saisonale Schwankungen und eine hohe Nichtlinearität bei den täglichen Entladungsmustern. Es gab eine definierte wöchentliche Musterentladung aus der Station erreichte am Freitag und sank deutlich am Wochenende (siehe Abbildung 2). Diese Saisonalität steht im Einklang mit früheren Studien 9. 32. Die Aggregation der täglichen Einleitungen in eine monatliche Zeitreihe ergab definierte monatliche Muster (siehe Abbildung 3). Die Daten zeigten keinen signifikanten Trend. Zusätzlich zeigte sich, daß das tägliche Entladungsmuster höchst nichtlinear war. Unsere Prognosemethoden müssen in der Lage sein, diese Datendynamik zu bewältigen. (1) ARIMA, (2) autoregressive Bewegung, (3) Prognose unter Verwendung von kNN-Entladungsmustern, (4) RF und (5) SVR. Autoregressive Methoden modellieren die zeitliche lineare Korrelation zwischen benachbarten Datenpunkten in der Zeitreihe. Nächste Muster heben diese Linearitätsannahme an und nehmen an, dass kurze Perioden wiederholte Muster bilden. Schließlich suchen RF und SVR eine nichtlineare funktionale Beziehung zwischen den zukünftigen Ergebnissen und Deskriptoren in der Vergangenheit. Mittlere Aufnahmen und Entladungen pro Tag aus der Station. Zeitreihen der monatlichen Einleitungen aus der Station. Vorhersageverfahren Autoregressive Integrierte Moving Average Zeitreihen-Prognosemethoden können das Muster vergangener Entladungen analysieren und ein Prognosemodell aus zugrunde liegenden zeitlichen Beziehungen formulieren 52. Solche Modelle können dann verwendet werden, um die Entladezeitreihen in die Zukunft zu extrapolieren. ARIMA-Modelle sind weit verbreitet in der Zeitreihen-Prognose eingesetzt. Ihre Popularität lässt sich auf die Einfachheit der Modellformulierung und Interpretierbarkeit zurückführen. ARIMA-Modelle suchen nach linearen Beziehungen in der Entladesequenz, um lokale Trends und Saisonalität zu erkennen. Allerdings können solche Beziehungen im Laufe der Zeit ändern. ARIMA-Modelle können diese Änderungen erfassen und entsprechend aktualisieren. Dies geschieht durch Kombination von autoregressiven (AR) und gleitenden Durchschnittsmodellen (MA). Autoregressive Modelle formulieren Entladung zum Zeitpunkt t y t. Als lineare Kombination früherer Entladungen. Auf der anderen Seite charakterisieren sich gleitende Durchschnittsmodelle als lineare Kombination früherer Prognosefehler. Für das ARIMA-Modell wird die Entladezeitreihe durch Differenzierung stationär hergestellt. Lassen Sie autoregressive Parameter, bewegte Durchschnittsparameter sein und die Prognosefehler sein. Ein solches ARIMA-Modell kann wie in Fig. 4 definiert definiert werden, wobei eine Konstante ist. Durch Variation von p und q. Können wir verschiedene Modelle zu den Daten passen. Box-Jenkins-Methode 54 liefert einen klar definierten Ansatz zur Modellidentifikation und Parameterschätzung. In unserer Arbeit wählen wir die Auto. arima () - Funktion aus dem Prognosepaket 55 in R 56, um automatisch das beste Modell auszuwählen. Klassisches ARIMA-Modell. Autoregressive Moving Average mit exogenen Variablen (ARMAX) Dynamische Regression Techniken ermöglichen das Hinzufügen zusätzlicher erklärender Variablen, wie Tag der Woche und Anzahl der aktuellen Patienten in der Station, um autoregressive Modelle. Das autoregressive Bewegen ARMAX modifiziert das ARIMA-Modell, indem es die externe Variable x t zur Zeit t einschließt. Wie in Abbildung 5 gezeigt. Wir modellieren x t mit Funktionen aus der Krankenhaus-Datenbank. ARIMA-Modell mit exogener Variable xt. Erkennen von Entladungsmustern unter Verwendung von k-Nearest Neighbours Der kNN-Algorithmus nutzt die Lokalität im Datenraum. Wir gehen davon aus, dass die Entladung am nächsten Tag von den Einleitungen in den vergangenen Tagen abhängt. Mit kNN Prinzipien können wir eine Regression zur Prognose der Entladung am nächsten Tag durchführen. Es sei y d die Anzahl der Entladungen am aktuellen Tag: d. Zur Prognose des nächsten Tages Entladung: y d1. Betrachten wir die Entladungen in den letzten p Tagen als: entladen y d-p. Y d. Unter Verwendung der euklidischen Entfernungsmetrik finden wir k engste Übereinstimmungen mit den Entladungsdaten aus den Trainingsdaten. Schätzung der Entladung am nächsten Tag: d1. Wird als Maß für die Entladungen am nächsten Tag der k angepaßten Muster berechnet: (y Übereinstimmung) i i (1: k). Abbildung 6 zeigt ein Beispiel einer kNN-basierten Prognose. Hier, Entladung in rot y d-7. Y d Ergebnisse in 3 Übereinstimmungen aus den Trainingsdaten. Zur Vereinfachung haben wir die abgestimmten Muster neben der Entladung aufgetragen, obwohl sie in der Vergangenheit aufgetreten waren. Die nächste Prognose d1 wird ein Maß für (y match) i. Wobei (y Übereinstimmung) i i (1: 3) der (d 1) - te Term von jedem der angepassten Muster 57 ist. Eine beliebte Methode zur Berechnung von d1 ist die Minimierung des gewichteten quadratischen Verlustes (Abbildung 7), wobei w i Werte zwischen 0 und 1 mit k i1 w i 1 annimmt. Allerdings gibt es zwei Hauptnachteile, die es weniger wünschenswert für unsere Daten. Erstens ist der quadratische Verlust empfindlich gegenüber Ausreißern. Zweitens wird eine robuste Abschätzung von i schwierig. Unsere Daten enthalten erhebliches Rauschen, was zu großen Schwankungen bei den Prognosen des nächsten Tages der k angepassten Muster führt. Wir veranschaulichen dieses Problem in Abbildung 8. Für einen gegebenen Tag gibt die kNN-Regression 125 abgestimmte Muster zurück. Die Prognosen des nächsten Tages aus jedem k125-Muster zeigten signifikante Unterschiede. In einem solchen Szenario schätzen wir t1 ein, indem wir den robusten Verlust minimieren (Abbildung 9). K-nächsten Nachbarprognosebeispiel mit k3 und P 7. Berechnung von d1 durch Minimierung des gewichteten quadratischen Verlustes. Scatterplot der nächsten Prognose mit k-nächsten Nachbarn für einen bestimmten Tag. Die X-Achse repräsentiert jedes abgestimmte Nachbarmuster. Die Y-Achse stellt die nächste Prognose des abgestimmten Musters dar. Abschätzen von t1 durch Minimierung des robusten Verlustes. Bei diesem Ansatz nehmen wir die Entladung am nächsten Tag als Funktion des historischen Deskriptorvektors an: x. Wir verwenden jeden Tag in der Vergangenheit als Datenpunkt, wo die Entladung am nächsten Tag das Ergebnis ist, und die kurze Zeit vor der Entladung werden verwendet, um Deskriptoren abzuleiten. Die in diesem Papier verwendete HF ist derzeit eine der leistungsfähigsten Methoden, um die Funktion y f (x) 58 zu modellieren. Ein RF ist ein Ensemble von Regressionsbäumen. Ein Regressionsbaum approximiert eine Funktion f (x), indem der Deskriptorraum rekursiv partitioniert wird. In jedem Bereich Rp. Wird die Funktion angenähert, wie in Fig. 10 gezeigt ist, wobei 124 Rp 124 die Anzahl der Datenpunkte ist, die in den Bereich Rp fallen. Die RF erzeugt eine vielfältige Sammlung von zufälligen Bäumen durch Variieren der Teilmengen von Datenpunkten, um die Bäume und die Teilmengen der Deskriptoren bei jedem Schritt der Raumpartitionierung zu schulen. Das Ergebnis der RF ist ein Durchschnitt aller Bäume im Ensemble. Da der Baumwachstum ein hochadaptiver Prozess ist, kann er jede nichtlineare Funktion in einem beliebigen Grad der Annäherung entdecken, wenn er genügend Trainingsdaten erhält. Allerdings macht die Flexibilität Regression Baum anfällig für Overfitting, das heißt, die Unfähigkeit zu verallgemeinern, um unsichtbare Daten. Dies erfordert das Steuern des Wachstums, indem die Anzahl der Deskriptoren pro Partitionierungsschritt und die minimale Größe des Bereichs R p eingestellt werden. Die Abstimmung führt zu großen Vorteilen: Reduzieren Sie die Variationen pro Baum. Die Zufälligkeit hilft gegen Überbeulen zu bekämpfen. Es gibt keine Annahme über die Verteilung der Daten oder die Form der Funktion (x). Es gibt kontrollierbare Qualität der Sitze. Random Wälder Formulierung der nächsten Tage Entladungen (y) aus historischen Deskriptoren (x). Stützvektorregression Der im RF-Modell verwendete historische Deskriptorvektor x kann auch verwendet werden, um ein SVR-Modell 60 zu erstellen. Angesichts der Menge der Daten 1. Y 1), (x 2 y 2), wobei x i R m den Eingabebeschreiber für die entsprechende nächste Tagesprognose y i R 1 bezeichnet. Eine Regressionsfunktion nimmt die Form an: i f (x i). SVR arbeitet durch (1) Zuordnen des Eingangsraums von x i in einen höherdimensionalen Raum unter Verwendung einer nichtlinearen Abbildungsfunktion:. (2) Durchführen einer linearen Regression in diesem höherdimensionalen Raum. Im allgemeinen können wir die Regressionsfunktion als: f (x) (w (x)) b ausdrücken, wobei w R m die Gewichte und b R 1 der Biasterm ist. Vapnik 60 schlug die & ndash; unempfindliche Verlustfunktion für SVR vor, die die Form annimmt, wie in Gleichung 1 in Fig. 11 gezeigt. Die Verlustfunktion L toleriert Fehler, die kleiner als die Schwelle sind, was zu einem Rohr um die wahren Entladungswerte führt. Modellparameter können durch Minimieren der Kostenfunktion, wie in Gleichung 2 in Fig. 11 gezeigt, abgeschätzt werden, wobei C eine Konstante ist, die einen Fehler beim Trainieren von Daten benachteiligt. In unserer Arbeit verwenden wir einen RBF-Kernel 61, um unsere Eingabedaten in höher dimensionierte Merkmalsräume abzubilden. RBF-Kerne sind eine gute Wahl, um unser nichtlineares Entladungsmuster anzupassen, und zwar aufgrund seiner Fähigkeit, die Trainingsdaten auf einen unendlich dimensionalen Raum und eine leichte Implementierung abzubilden. Die Lösung der doppelten Formulierung der SVR-Kostenfunktion ist in 60 dargestellt. Das SVR-Lernmodell. Wir haben alle Daten aus den Datenbanktabellen (wie in Tabelle 1) für unsere Station entnommen. Der Patientendurchfluss wurde für einen Zeitraum von 5 Jahren analysiert. Wir haben unsere Daten als Matrix formatiert, wobei jede Zeile einem Tag entspricht und jede Spalte ein Merkmal (Deskriptor) darstellt. Es wurden zwei Hauptgruppen von Merkmalen identifiziert: (1) Stationsebene und (2) Patientenebene. Unser Merkmalserstellungsprozess führte zu 20 stationären und 88 Patienten-Level-Prädiktoren, wie in Tabelle 3 aufgelistet. Der Ward-Level-Deskriptor: Trend der Entladung am nächsten Tag wurde durch Anpassen einer lokal gewichteten Polynomregression 63 aus früheren Entladungen berechnet. Ein Beispiel für diese Regressionsanpassung ist in gezeigt. Merkmale aus Stationsdaten in der Krankenhausdatenbank. A a Der Zufallswald und die Unterstützungsvektorregressionsmodelle verwendeten den vollen Satz von Merkmalen. Die ARMAX (autoregressive gleitende Durchschnitt mit exogenen Variablen) Modell verwendet Saisonalität und Belegung. Alle anderen Modelle wurden aus täglichen Entladungen abgeleitet. Ein Beispiel für den Entladungstrend, wie er sich aus einem lokal gewichteten polynomischen Regressionsmodell ergibt. Unsere Trainings - und Testsets sind zeitlich getrennt. Diese Strategie spiegelt die gängige Praxis der Ausbildung des Modells mit Daten in der Vergangenheit und Anwendung auf zukünftige Daten. Die Trainingsdaten betrugen 1460 Tage vom 1. Januar 2010 bis zum 31. Dezember 2013. Die Testdaten bestanden aus 365 Tagen im Jahr 2014. Die Charakteristika der Trainings - und Validierungskohorte sind in Tabelle 4 dargestellt. Die meisten Aufenthalte waren kurz, rund 65 Jahre Der Patienten für weniger als 5 Tage. Merkmale von Trainings - und Validierungskohorten. Die gegenwärtige Krankenhausstrategie beinhaltet die Verwendung von Erfahrungen aus der Vergangenheit, um verfügbare Betten vorzusehen. Um die Effizienz unserer vorgeschlagenen Ansätze zu vergleichen, modellieren wir die folgenden Basislinien: (1) Naive Prognose mit dem letzten Tag der Wochenentladung: Da unsere Daten wöchentliche Definitionen haben, modellieren wir die nächste Tagesentladung als Anzahl der Entladungen (2) naive Prognose mit Mittelwerten der letzten Woche: Um die Variation und den Lärm in wöchentlichen Entladungen besser zu modellieren, modellieren wir die Entladung am nächsten Tag als Mittelwert der Einleitungen während der vergangenen 7 Tage und (3) Naive Prognose mit Mittelwert der letzten 3-Wochen-Entladungen: Um die monatlichen und wöchentlichen Veränderungen in unseren Daten zu berücksichtigen, verwenden wir Mittel der täglichen Entladungen in den letzten 3 Wochen, um die Entladung am nächsten Tag zu modellieren. Messung der Prognoseleistung Wir vergleichen die Prognosen für die nächsten Tage unserer vorgeschlagenen Ansätze mit den Baseline-Methoden auf den Maßnahmen des mittleren Prognosefehlers, des mittleren Absolutfehlers, des symmetrischen mittleren absoluten Prozentfehlers und des quadratischen Mittelwertes 64. 65. Wenn y t die gemessene Entladung zum Zeitpunkt t ist. F t die prognostizierte Dishcharge zum Zeitpunkt t ist. Können wir Folgendes definieren: Mittelwertprognosefehler (MFE): wird verwendet, um Modellvorspannung zu messen und wird als MFE-Mittelwert (yt - ft) berechnet. Für ein ideales Modell ist MFE 0. Wenn MFE 62 0 ist, neigt das Modell zu einer Unterprognose. Wenn MFE 60 0, tendiert das Modell dazu, eine Vorhersage durchzuführen. Mittlerer absoluter Fehler (MAE): Der Mittelwert der unsigned Fehler: MAE mean124 y t - f t 124. MAE gibt die absolute Größe der Fehler an. Root mean square error (RMSE) ist ein Maß für die Abweichung von Prognosefehlern. Sie wird berechnet als: RMSE-Mittelwert (yt - ft) 2 Aufgrund der Quadrierung und der Mittelung neigen große Fehler dazu, mehr Einfluss auf RMSE zu haben. Im Gegensatz dazu werden einzelne Fehler gleichmäßig in MAE gewichtet. Es gab viel Diskussion über die Wahl der MAE oder RMSE als Indikator für die Modellleistung 66. 67. Symmetrischer mittlerer absoluter Prozentsatzfehler (sMAPE): Er ist skalenunabhängig und kann daher verwendet werden, um die Prognoseleistung zwischen verschiedenen Datenreihen zu vergleichen. Es überwindet 2 Nachteile des mittleren absoluten prozentualen Fehlers (MAPE), nämlich (1) die Unfähigkeit, Fehler zu berechnen, wenn die wahre Entladung Null ist, und (2) schwerere Strafen für positive Fehler als negative Fehler. SMAPE ist eine robustere Schätzung des Prognosefehlers und wird berechnet als: sMAPE mean (200124 y t - f t 124 y t f t). Jedoch reicht sMAPE von 200 bis 200 und gibt ihm eine zweideutige Interpretation 68. Ergebnisse Modell Leistung In diesem Abschnitt beschreiben wir die Ergebnisse des Vergleichs unserer verschiedenen Prognosemethoden. Die Modellparameter für kNN-Prognose-, RF - und SVR-Modelle wurden abgestimmt, um Prognosefehler zu minimieren. Für die kNN-Regression ist der optimale Wert der Musterlänge: d und die Anzahl der nächsten Nachbarn: k. Wurde durch Analysieren der Prognose RMSE für die Werte d (1100) und k (5,1000) erhalten. Eine minimale RMSE von 3,77 wurde bei d 70 und k 125 erhalten. Die SVR-Parameter C (Strafkosten) und (Betrag des erlaubten Fehlers) wurden bestimmt, indem der beste Wert aus einer Gittersuche ausgewählt wurde, der das Modell RMSE minimierte. In ähnlicher Weise wurde die optimale Anzahl von Variablen beim Aufbauen jedes Knotens der HF ausgewählt, indem ihre Wirkung auf die Minimierung der Out-of-Bag-Schätzung untersucht wurde. Wir verglichen die naiven Prognosemethoden mit unseren vorgeschlagenen 5 Modellen mit MFE, MAE, RMSE und sMAPE. Die Ergebnisse sind in Tabelle 5 zusammengefasst, wohingegen 13 die Verteilung der tatsächlichen Entladungen mit unterschiedlichen Modellvorhersagen vergleicht. Prognosegenauigkeit verschiedener Modelle. Ein ARIMA: autoregressiver integrierter gleitender Durchschnitt b ARMAX: autoregressiver gleitender Durchschnitt mit exogenen Variablen Die naiven Prognosen können nicht alle Variationen der Daten erfassen und im Vergleich zu anderen Modellen den maximalen Fehler ergeben. In den Modellen ARIMA und ARMAX werden die Unterschiede in der Saisonalität und dem Trend besser erfasst. Die Zeitreihen, die aus vergangenen 3-Monats-Einleitungen bestanden, wurden für die Erstellung der Tagesprognose verwendet. Das ARMAX-Modell umfasste auch den Wochentag und die Stationsbelegung als exogene Variablen, was zu einer besseren Prognoseleistung über ARIMA führte. Interessanterweise war kNN erfolgreicher als ARIMA und ARMAX bei der Erfassung der Schwankungen in der Entladung, was etwa 3 Verbesserung in MAE, verglichen mit ARMAX. Jedoch neigt das kNN-Modell zu einer Prognose (MFE 1,09), möglicherweise aufgrund der Rückgriff auf Medianwerte für die Prognose. Im Vergleich dazu zeigten RF - und SVR-Prognosemodelle bessere Ergebnisse. Dies kann erwartet werden, weil sie von allen 108 Funktionen abgeleitet sind. Allerdings zeigte RF eine relative Verbesserung von 3,3 in MAE über SVR-Modell (siehe Tabelle 5). Bei der Betrachtung der Prognosefehler für jeden Wochentag bestätigte das HF-Modell eine bessere Leistung, wie in Abbildung 14 gezeigt. Der Prozess des SVR mit dem RBF-Kernel ordnet alle Daten in einen höherdimensionalen Raum. Daher können die ursprünglichen Merkmale, die für die Prognose verantwortlich sind, nicht wiederhergestellt werden, und das Modell fungiert als eine Black Box. Alternativ liefert der HF-Algorithmus eine Schätzung der Wichtigkeit für jede Variable für die Regression zurück. Die Untersuchung der Merkmale mit hoher Bedeutung könnte uns ein besseres Verständnis der Entlastung Prozess. Vergleich der tatsächlichen und prognostizierten Entladungen von Station für jeden Tag im Jahr 2014. Prognosefehler bei der Vorhersage für jeden Tag der Woche im Jahr 2014. Bedeutung der Bedeutung in der Random-Forest-Modell Die Merkmale in der zufälligen Prognose-Modell wurden auf die Wichtigkeit Scores eingestuft. Die 10 wichtigsten Merkmale werden wie folgt beschrieben. Der Tag der Woche für die Prognose erwies sich als das wichtigste Merkmal. Weitere Merkmale waren die Anzahl der Patienten in der Station während des Tages der Prognose, der Trend der Entladungen gemessen mit lokal gewichteten polynomialen Regression, Anzahl der Entladungen in der Vergangenheit 14. Tag, Anzahl der Entladungen im vergangenen 21. Tag, Anzahl der Patienten, die nur eine besucht hatte Vorherige Station, Anzahl der Männer in der Station, Anzahl der Patienten, die als: öffentlicher Standard und aktueller Monat der Prognose gekennzeichnet sind. Diskussion Hauptergebnisse Verbesserter Patientendurchsatz und effizientes Bettenmanagement sind der Schlüssel für den zunehmenden Eskalationsdruck und den wirtschaftlichen Druck in Krankenhäusern. Die Vorhersage der Entladungen am nächsten Tag ist entscheidend, wurde aber selten für allgemeine Stationen untersucht. Im Vergleich zur Notfall - und Akutversorgung ist die Vorhersage der Entladungen am nächsten Tag aus einer allgemeinen Station wegen der Nichtverfügbarkeit von klinischen Informationen in Echtzeit schwieriger. Das tägliche Entladungsmuster ist saisonal und unregelmäßig. Dies könnte auf das Management von Krankenhausprozessen zurückzuführen sein, wie z. B. stationäre Runden, stationäre Tests und Medikamente. Die nichtlineare Natur dieser Prozesse trägt auch bei Patienten mit ähnlicher Diagnose zu einer unberechenbaren Aufenthaltsdauer bei. Typischerweise verwendet ein Bodenverwalter für offene Stationen vorherige Erfahrung, um die Anzahl der verfügbaren Betten vorauszusehen. In dieser Arbeit versuchen wir, die Gesamtzahl der Entladungen am nächsten Tag anhand von 5 Methoden zu modellieren. Wir haben die Prognoseperformance mit MAE, RMSE und sMAPE verglichen. Unsere Prädiktoren werden aus allgemein verfügbaren Daten in der Krankenhausdatenbank extrahiert. Obwohl das kNN-Verfahren einfach zu implementieren ist und keine spezielle Expertise erfordert, sind Softwarepakete für andere Modelle für alle gängigen Plattformen verfügbar. Diese Modelle können von den Analytikern in der Krankenhaus-IT-Abteilung implementiert werden und können problemlos in bestehende Gesundheitsinformationssysteme integriert werden. In unseren Experimenten, Prognose basierend auf HF-Modell übertraf alle anderen Modelle. Die Prognosefehlerrate beträgt 31,9 (gemessen durch sMAPE), die sich im selben Ballpark befindet wie die jüngste Arbeit von 24, obwohl wir keine klinischen Informationen in Echtzeit hatten. Ein HF-Modell bildet minimale Annahmen über die zugrunde liegenden Daten. Daher ist es die flexibelste, und gleichzeitig kommt mit großer Überbeanspruchung Kontrolle. Similarly, SVR also demonstrated superior performance, compared with the autoregressive and kNN models. The RBF kernel maps the features into a higher dimensional space during the regression process. Hence, the physical meaning of the features is lost, making it difficult to interpret the model. Finally, RFs and SVR are able to handle more features. This extra information in the form of patient demographics and past admission and discharge statistics contributed to improve the predictive performance when compared with other models. The kNN regression also performed well as it assumes only the locality in the data. But it is not adaptive, and thus less flexible in capturing complex patterns. The kNN regression assumes similar patterns in past discharges extrapolate to similar future discharge, which is not true for daily discharges from ward. ARMAX model outperformed the traditional ARIMA forecasts since it incorporated seasonal information as external regressors. As expected, a naive forecast of using the median of past discharges performed worst. We noticed a weekly pattern ( Figure 2 ) and monthly pattern ( Figure 3 ) in discharges from the ward. Other studies have also confirmed that discharges peak on Friday and drop during weekends 5. 9. 10 . This weekend effect could be attributed to shortages in staffing or reduced availability of services like sophisticated tests and procedures 10. 69 . This suggests discharges are heavily influenced by administrative reasons and staffing. Feature importance score from an RF model helps in identifying the features contributing to the regression process. The day of forecast proved to be one of the most important features in the RF model. Other important features included trend based on nonlinear regression of past weekdays, number of discharges in the past days, ward occupancy in previous day, number of males in the ward, and number of general patients in ward. When looking at for each day of the week, the RF and SVR model consistently outperformed other models. Sundays and Thursdays proved to be the easiest to predict for all models ( Figure 14 ). This can be expected since these days had the least variation in our data. Fridays proved to be the most difficult to forecast. Retraining the RF model by omitting day of the week increased the forecast error by 1.39 (as measured by sMAPE). Patient length of stay is inherently variable, partly due to the complex nonlinear structure of medical care 8 . The number of discharges from a ward is strongly related to the length of stay of the current patients in the ward. Hence, the variability in ward-level discharges is compounded by the variability in individual patient length of stay. In our study, the daily discharge pattern from ward shows great variation for each day of week. Apart from patient level details, we believe that a knowledge of hospital policies is also required to capture such nonlinearity. In our study, we were able to validate that the weekend patterns affect discharges from a general ward. The RF model was able to give a reasonable estimate of number of next-day discharges from the ward. Clinical staff can use this information as an aid to decisions regarding staffing and resource utilization. This foresight can also aid discharge planning such as communication and patient transfer between wards or between hospitals. An estimate of number of free beds can also help reduce emergency department (ED) boarding time and improve patient flow 12. 23 . ED boarding time is the time spent by a patient in emergency care when a bed is not available in the ward. ED boarding time severely reduces the hospital efficiency. High bed occupancy in ward directly contributes to ED overcrowding 70 . In our data, 42.81 of patients were admitted from the emergency care. An estimate of daily forecasts can be helpful in deciding the number of beds in wards to ease patient flow. We acknowledge the following limitations in our study. First, we focused only on a single ward. However, it was a ward with different patient types, and hence the results could be an indication for all general wards. Second, we did not use patient clinical data to model discharges. This was because clinical diagnosis data were available only for 42.81 of patients who came from emergency. In a general ward, clinical coding is not done in real time. However, we believe that incorporating clinical information to model patient length of stay could improve forecasting performance. Third, we did not compare our forecasts with cliniciansmanaging nurses. Finally, our study is retrospective. However, we have selected prediction period separated from development period. This has eliminated possible leakage and optimism. This study set out to model patient outflow from an open ward with no real-time clinical information. We have demonstrated that using patient-level and ward-level features in modelling forecasts outperforms the traditional autoregressive methods. Our proposed models are built from commonly available data and hence could be easily extended to other wards. By supplementing patient-level clinical information when available, we believe that the forecasting accuracy of our models can be further improved. Autoregressive Moving Average Im working on two-dimensional AR modelling and using the from Matlab. In Matlab gibt es eine lobende LPC, die die LP-Koeffizienten berechnen kann. Wie kann ich in zwei Dimensionen für Image integrieren? Der Matlab-Code für ein Dimensionssignal ist alpc (Signal, Ordnung) estsignal Filter (0 - a (2: Ende), 1, Signal) Fehlersignal-estsignal Es gibt eine Implementierung bei MATLAB Exchange Die von Simona Maggio 2D AR und 2D ARMA-Parameter Schätzung aus der Referenz: Zwei-dimensionale ARMA-Modellierung für Brustkrebs-Erkennung und Klassifizierung von N. Bouaynaya, J. Zielinski und D. Shonfeld in IEEE Internationale Konferenz über Signalverarbeitung und Kommunikation, Bangalore, Indien, Juli 2010 Betrachten Sie diese Situation. 60 Drogebehandlungaufstellungsorte. Abhängige Variable der Teilnehmer an jeder medikamentösen Behandlungsstelle auf Drug A. Propensity Matched (für einzelne Ebene und Website-Ebene Merkmale) Kontrollgruppe erstellt mit Daten. Abhängige Variable gesammelt jedes Quartal für 2 Jahre vor der Intervention an 60 Standorten eingeführt und für 4 Jahre nach der Intervention. Wollen Sie wissen, ob die Intervention Auswirkungen auf die Einnahme von Medikamenten hat A. Ist ARIMA der Weg hierher zu gehen Ja, ich denke auch Vorhersage Methoden, z. ARIMA sind in diesem Fall nicht geeignet, z. B. Statistische Tests für die Gruppe Vergleich wäre besser geeignet. Ich habe täglich Daten mit einem ARMAX-Modell mit saisonalen ARMA-Komponenten modelliert. Meine abhängige Variable ist die Menge der Webbesuche zu einer Web site wegen der täglichen Fernsehwerbung lüftet. Meine Variablen werden stationär und saisonabhängig gesteuert, so dass meine Residuen unautokorreliert und unbedeutend weißes Rauschen sind. Ich bin leicht in der Lage zu sehen, die Auswirkungen, die meine exogenen (Werbung) Variablen auf unmittelbaren Web-Verkehr haben, aber ich möchte einen Wachstumsfaktor zu integrieren. Das heißt, die Werbungsvariablen sollten einen unmittelbaren Einfluss haben, der auf unbestimmte Zeit fortgesetzt wird, bevor sie aussterben. Das Ziel ist, zurück zu gehen und zu betrachten, wie Netzverkehr aussehen würde, wenn Werbung für x Zeitmenge aufhören sollte. Wenn ich rekursiv mit meinen Modellparametern projiziert, in der Mitte des Datensatzes, folgt er den beobachteten Werten für eine Weile, aber letztlich bricht er ab und beginnt, um einen Mittelwert weit unterhalb der beobachteten Daten zu isolieren. Ich glaube, es ist, weil das Modell nicht korrekt Compoundierung der kontinuierlichen Auswirkungen der Werbetätigkeit so Vergangenheit Werbung ist nicht beeinflussen künftigen Web-Verkehr. Meine Fragen wären, wie ich meine Daten modellieren, indem ich die Effekte von Werbung in langfristige Effekte zusammenfasse Wie würde ich im Wesentlichen Prognose verwenden, um vorherzusagen, was Webbesuche sein würden, wenn Werbung zu irgendeinem Zeitpunkt in meinem Datensatz gestoppt wurde Split die Daten in Zwei Teile und dann überprüfen. Das ist vor der Pause und nach der Pause Wie kann ich einen ARMA-Prozess in Matlabltspan simulieren idmcemarker data-mce-typebookmarkgtltspangtltspan idcaretgtltspangtWie kann ich einen ARMA-Prozess in Matlabltspan simulieren idmcemarker data-mce-typebookmarkgtltspangt Wie kann ich einen ARMA-Prozess in Matlab ARMA simulieren Autoregressive Moving Average Model) MATLAB amp Simulink Ich empfehle Ihnen, diese Dokumente zu sehen. Sie finden, was Sie brauchen. Ich hoffe, dass ich Ihnen geholfen habe, lassen Sie uns wissen, wenn Sie eine andere Frage haben oder Sie brauchen mehr Details. Mit freundlichen Grüßen

Comments

Popular posts from this blog

Best Stock Optionen Für 2015

Best Stock Optionen Buch

Toms Ea Review Forex Friedensarmee