Какая статистика может сохраняться для ряда числовых данных без итерации?

Question

Какая статистика может сохраняться для ряда числовых данных без итерации?

Поскольку автор не был достаточно любезен, чтобы дать SQL для создания схемы, здесь он предназначен для всех, кто хочет попробовать решение из @Eric.

create table markdetails (studid, subjectid, marks);
create table student_info (studid, name);

insert into markdetails values('A1', 3, 50);
insert into markdetails values('A1', 4, 60);
insert into markdetails values('A1', 5, 70);
insert into markdetails values('B1', 3, 60);
insert into markdetails values('B1', 4, 80);
insert into markdetails values('C1', 5, 95);

insert into student_info values('A1', 'Raam');
insert into student_info values('B1', 'Vivek');
insert into student_info values('C1', 'Alex');

Вот альтернативное решение с использованием case с group by.

select
    si.studid,
    si.name,
    sum(case when md.subjectid = 3 then md.marks end) subjectid_3,
    sum(case when md.subjectid = 4 then md.marks end) subjectid_4,
    sum(case when md.subjectid = 5 then md.marks end) subjectid_5
from student_info si
join markdetails md on
        md.studid = si.studid
group by si.studid, si.name
;

Для сравнения, вот то же утверждение select из решения @ Eric:

select
    u.stuid,
    u.name,
    s3.marks as subjectid_3,
    s4.marks as subjectid_4,
    s5.marks as subjectid_5
from
    student_info u
    left outer join markdetails s3 on
        u.stuid = s3.stuid
        and s3.subjectid = 3
    left outer join markdetails s4 on
        u.stuid = s4.stuid
        and s4.subjectid = 4
    left outer join markdetails s5 on
        u.stuid = s5.stuid
        and s5.subjectid = 5
;

Будет интересно посмотреть, какой из них будет работать лучше при большом количестве данных. .

8

language-agnostic math statistics iteration

задан Dan Tao 15 June 2010 в 01:26

8 ответов

Чтобы постоянно поддерживать высокий / низкий уровень, вы храните свои данные в отсортированном порядке. Существуют алгоритмы для поддержки структур данных, которые сохраняют порядок.

Медиана тривиальна, если данные упорядочены.

Если данные немного сокращаются до частотной таблицы, вы можете поддерживать режим. Если вы храните данные в виде случайного плоского списка значений, вы не сможете легко вычислить режим при наличии изменений.

3