Recommended Posts

...can't escape the moon
Petroleum schrieb vor einer Stunde:

Vielleicht kennt sich wer aus bzw. hat eine Idee, wie man das formal lösen könnte. Ich habe 2 Spalten mit Zahlenwerten. Die Werte und den einzelnen Zeilen stehen dabei in einer Beziehung. Ich behaupte: Je höher der Wert in Spalte A, desto höher ist die Wahrscheinlichkeit, dass in Spalte B ein Wert >0 aufscheint (die Zahlen in B kommen insgesamt deutlich seltener vor). Also Wenn in A nur eine 1 steht, steht bei B meistens 0. Wenn bei A aber 234 steht, ist es höchst unwahrscheinlich, dass in B keine Werte zu finden sind. Welches statistische Mittel kann diese These bestätigen?

Gemini hat folgende Antwort:

https://g.co/gemini/share/6fa0e0df2934

 

 

Um die Beziehung zwischen den beiden Spalten mit Zahlenwerten zu untersuchen, können Sie verschiedene statistische Verfahren in Betracht ziehen, die für die Analyse von kategorialen und numerischen Daten geeignet sind.

Geeignete statistische Tests:

 * Chi-Quadrat-Test: Dieser Test prüft die Unabhängigkeit zwischen zwei kategorialen Variablen. In diesem Fall können Sie die Werte in Spalte A als kategoriale Variable und das Auftreten von Werten >0 in Spalte B als zweite kategoriale Variable betrachten. Ein signifikanter Chi-Quadrat-Test würde darauf hinweisen, dass die beiden Variablen nicht unabhängig voneinander sind, d.h. dass die Höhe des Werts in Spalte A mit der Wahrscheinlichkeit eines Werts >0 in Spalte B zusammenhängt.

 * Korrelationsanalyse: Diese Methode misst die Stärke und Richtung der linearen Beziehung zwischen zwei numerischen Variablen. In diesem Fall können Sie die Werte in beiden Spalten als numerische Variablen betrachten. Ein positiver Korrelationskoeffizient würde darauf hinweisen, dass mit steigenden Werten in Spalte A auch die Werte in Spalte B tendenziell steigen.

 * Regressionsanalyse: Diese Methode modelliert die Beziehung zwischen einer abhängigen numerischen Variablen (z. B. Spalte B) und einer oder mehreren unabhängigen numerischen Variablen (z. B. Spalte A). Mit der Regressionsanalyse können Sie die Stärke des Einflusses von Spalte A auf Spalte B quantifizieren und Vorhersagen über die Werte in Spalte B treffen, basierend auf den Werten in Spalte A.

Zusätzliche Überlegungen:

 * Datenexploration: Vor der Anwendung statistischer Tests ist es wichtig, die Daten explorativ zu analysieren, um die Verteilungen der Werte in beiden Spalten zu verstehen und mögliche Ausreißer zu identifizieren.

 * Wahl des Tests: Die Wahl des geeigneten statistischen Tests hängt von der Art der Daten, der Forschungsfrage und den Annahmen des jeweiligen Tests ab.

 * Interpretation der Ergebnisse: Die Ergebnisse statistischer Tests sollten immer im Kontext der Forschungsfrage und der zugrunde liegenden Annahmen interpretiert werden.

Es ist wichtig zu beachten, dass diese statistischen Verfahren nur Assoziationen zwischen den beiden Spalten aufdecken können, aber keine kausalen Zusammenhänge beweisen. Um Kausalität zu folgern, wären weitere Untersuchungen erforderlich.

Weitere Informationen:

 * https://de.wikipedia.org/wiki/Statistischer_Test

 * https://de.wikipedia.org/wiki/Korrelation

 * https://de.wikipedia.org/wiki/Regressionsanalyse

Diesen Beitrag teilen


Link zum Beitrag
Auf anderen Seiten teilen

No Fuchs Given
Petroleum schrieb vor 18 Stunden:

Vielleicht kennt sich wer aus bzw. hat eine Idee, wie man das formal lösen könnte. Ich habe 2 Spalten mit Zahlenwerten. Die Werte und den einzelnen Zeilen stehen dabei in einer Beziehung. Ich behaupte: Je höher der Wert in Spalte A, desto höher ist die Wahrscheinlichkeit, dass in Spalte B ein Wert >0 aufscheint (die Zahlen in B kommen insgesamt deutlich seltener vor). Also Wenn in A nur eine 1 steht, steht bei B meistens 0. Wenn bei A aber 234 steht, ist es höchst unwahrscheinlich, dass in B keine Werte zu finden sind. Welches statistische Mittel kann diese These bestätigen?

Ich habe selbst keinen Plan, aber hatte gerade Perplexity Pro offen - verstehe nur Bahnhof aber vielleicht hilft es :D 

Zitat

Basierend auf den Suchergebnissen gibt es mehrere Möglichkeiten, die Beziehung zwischen den Werten in Spalte A und B in Excel zu analysieren:

Logistische Regression
Da Spalte B eine dichotome Variable ist (Werte >0 vs. 0), bietet sich eine logistische Regression an. Dazu muss man die Werte in B zunächst in 0 und 1 umkodieren. Dann kann man in Excel über Daten -> Datenanalyse -> Regression die logistische Regression durchführen, mit Spalte A als unabhängige und der umkodierten Spalte B als abhängige Variable.
Ein positiver Regressionskoeffizient b für Spalte A würde die Hypothese stützen, dass höhere Werte in A mit einer größeren Wahrscheinlichkeit für Werte >0 in B einhergehen.

Punktbiseriale Korrelation
Eine weitere Möglichkeit ist die Berechnung der punktbiserialen Korrelation zwischen Spalte A und der dichotomisierten Spalte B. Dies funktioniert genauso wie die Berechnung einer normalen Korrelation in Excel, z.B. mit der Funktion =KORREL()
Ein positiver Korrelationskoeffizient würde einen positiven Zusammenhang zwischen den Werten in A und der Wahrscheinlichkeit für Werte >0 in B anzeigen.

Visualisierung mit einem Mosaik-Plot
Zur grafischen Veranschaulichung kann man die Daten auch in einer Kontingenztabelle darstellen, bei der Spalte A in Kategorien eingeteilt wird. In den Zellen trägt man dann die beobachteten Häufigkeiten für B=0 und B>0 ein.
Diese Tabelle lässt sich in einem Mosaik-Plot visualisieren, bei dem der Anteil der Zellen mit B>0 von links nach rechts mit zunehmenden Werten in A immer größer werden sollte, wenn die Hypothese stimmt.

Leider bietet Excel keine direkte Funktion für Mosaik-Plots, man kann aber mit bedingter Formatierung oder Sparklines eine ähnliche Darstellung erreichen.
Mein Vorschlag wäre, zunächst mit einer logistischen Regression oder punktbiserialen Korrelation den Zusammenhang statistisch zu testen. Zur Veranschaulichung könnte man dann noch einen Mosaik-Plot erstellen, auch wenn dies in Excel etwas aufwendiger ist. Die Kombination aus rechnerischer Analyse und grafischer Darstellung liefert die besten Erkenntnisse über die Daten.

 

bearbeitet von CounterKreuzi

Diesen Beitrag teilen


Link zum Beitrag
Auf anderen Seiten teilen

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung jetzt entfernen

  Only 75 emoji are allowed.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.



  • Folge uns auf Facebook

  • Partnerlinks

  • Unsere Sponsoren und Partnerseiten

  • Wer ist Online

    • Keine registrierten Benutzer online.