Ideone.com

fork download

copy

import urllib, urllib2, cookielib, re, operator, getpass
 
id = ''   # Enter your id here to save typing it again.
passwd = ''   # Enter your password here at your own risk.
 
def get_num_pages_for_members():
    url = 'http://w...content-available-to-author-only...s.com/club/mitbbs_club_member.php?club=Topcoders&pagen=1'
    page = opener.open(url)
    pagedata = page.read()
 
    # Grab the # total pages (text) beside the select drop-down box
    select_drop_down_pages = re.search(ur'</select>/(\d+)\u00D2\u00B3\]</form>', pagedata)
 
    if select_drop_down_pages:
        num_pages = select_drop_down_pages.group(1)
    else:
        num_pages = 0
 
    return int(num_pages)
 
def get_members_list():
    members = []
 
    num_pages = get_num_pages_for_members()
 
    for page in range(0, num_pages):
        url = 'http://w...content-available-to-author-only...s.com/club/mitbbs_club_member.php?club=Topcoders&pagen=%d' % (page + 1)
 
        page = opener.open(url)
        pagedata = page.read()
 
        members += re.findall(r'"/user_info/([a-zA-Z0-9]+)', pagedata)
 
    return members
 
def get_page(url):
    page = opener.open(url)
    pagedata = page.read()
 
    # [shang ye][<a href="next_page_url" class="news">xia ye</a>]
    next_page = re.search(ur'\u00C9\u00CF\u00D2\u00B3.+\[<a href="(.+)" class="news">\u00CF\u00C2\u00D2\u00B3</a>\]', pagedata)
    return (next_page, pagedata)
 
def sort_post_by_count(posts):
    sorted_post_by_count = sorted(posts.iteritems(), key = operator.itemgetter(1))
    sorted_post_by_count.reverse()
 
    return sorted_post_by_count
 
 
url = 'http://w...content-available-to-author-only...s.com/newindex/mitbbs_bbslogin.php'
 
if id == '':
    id = raw_input('Please enter your user id: ')
if passwd == '':
    passwd = getpass.getpass()
 
data = [
    ('id',         id),
    ('passwd',     passwd),
    ('kick_multi', '1')]   # confirm login with multi_session.
 
cj = cookielib.CookieJar()
 
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
 
print 'Logging in...'
response = opener.open(url, urllib.urlencode(dict(data)))
 
home_page = response.read()
 
# There's two type of error message that might return:
# alert ("yong hu ming cuo wu, huo xi tong fan mang, qing chong xin deng lu!")
# alert("yong hu mi ma cuo wu, qing chong xin deng lu!")
# Notice the extra space character in the first error message.
# D3 C3 is the gb2312 code for 'yong', and BB A7 is for 'hu'.
if re.search(ur'alert\s*\("\u00D3\u00C3\u00BB\u00A7', home_page):
    print 'Failed to login. Please try again.'
    exit(1)
 
 
print 'Login successfully.'
 
posts = {}
 
# wen zhang mo shi (first page)
url = 'http://w...content-available-to-author-only...s.com/club_bbsdoc1/Topcoders_1_3.html'
 
while True:
    (next_page, pagedata) = get_page(url)
    print "Processing page [" + url + "]..."
 
    # get all user names, user name can only contain alphanumeric characters, ie: [a-zA-Z0-9]
    users = re.findall(r'\'/user_info/([a-zA-Z0-9]+)', pagedata)
    for user in users:
        posts[user] = posts.get(user, 0) + 1
 
    if not next_page:
        break;
 
    next_page_url = next_page.group(1)
    url = 'http://w...content-available-to-author-only...s.com' + next_page_url
 
 
print ""
print "Members who never posted"
print "------------------------"
all_users = get_members_list()
 
for user in all_users:
    if posts.get(user, 0) == 0:
        print user
 
 
print ""
print "Members sorted by #posts"
print "------------------------"
posts = sort_post_by_count(posts)
 
for (user, num_posts) in posts:
    print "%s: %d" % (user, num_posts)

aW1wb3J0IHVybGxpYiwgdXJsbGliMiwgY29va2llbGliLCByZSwgb3BlcmF0b3IsIGdldHBhc3MKCmlkID0gJycgICAjIEVudGVyIHlvdXIgaWQgaGVyZSB0byBzYXZlIHR5cGluZyBpdCBhZ2Fpbi4KcGFzc3dkID0gJycgICAjIEVudGVyIHlvdXIgcGFzc3dvcmQgaGVyZSBhdCB5b3VyIG93biByaXNrLgoKZGVmIGdldF9udW1fcGFnZXNfZm9yX21lbWJlcnMoKToKICAgIHVybCA9ICdodHRwOi8vdy4uLmNvbnRlbnQtYXZhaWxhYmxlLXRvLWF1dGhvci1vbmx5Li4ucy5jb20vY2x1Yi9taXRiYnNfY2x1Yl9tZW1iZXIucGhwP2NsdWI9VG9wY29kZXJzJnBhZ2VuPTEnCiAgICBwYWdlID0gb3BlbmVyLm9wZW4odXJsKQogICAgcGFnZWRhdGEgPSBwYWdlLnJlYWQoKQoKICAgICMgR3JhYiB0aGUgIyB0b3RhbCBwYWdlcyAodGV4dCkgYmVzaWRlIHRoZSBzZWxlY3QgZHJvcC1kb3duIGJveAogICAgc2VsZWN0X2Ryb3BfZG93bl9wYWdlcyA9IHJlLnNlYXJjaCh1cic8L3NlbGVjdD4vKFxkKylcdTAwRDJcdTAwQjNcXTwvZm9ybT4nLCBwYWdlZGF0YSkKCiAgICBpZiBzZWxlY3RfZHJvcF9kb3duX3BhZ2VzOgogICAgICAgIG51bV9wYWdlcyA9IHNlbGVjdF9kcm9wX2Rvd25fcGFnZXMuZ3JvdXAoMSkKICAgIGVsc2U6CiAgICAgICAgbnVtX3BhZ2VzID0gMAoKICAgIHJldHVybiBpbnQobnVtX3BhZ2VzKQoKZGVmIGdldF9tZW1iZXJzX2xpc3QoKToKICAgIG1lbWJlcnMgPSBbXQoKICAgIG51bV9wYWdlcyA9IGdldF9udW1fcGFnZXNfZm9yX21lbWJlcnMoKQoKICAgIGZvciBwYWdlIGluIHJhbmdlKDAsIG51bV9wYWdlcyk6CiAgICAgICAgdXJsID0gJ2h0dHA6Ly93Li4uY29udGVudC1hdmFpbGFibGUtdG8tYXV0aG9yLW9ubHkuLi5zLmNvbS9jbHViL21pdGJic19jbHViX21lbWJlci5waHA/Y2x1Yj1Ub3Bjb2RlcnMmcGFnZW49JWQnICUgKHBhZ2UgKyAxKQoKICAgICAgICBwYWdlID0gb3BlbmVyLm9wZW4odXJsKQogICAgICAgIHBhZ2VkYXRhID0gcGFnZS5yZWFkKCkKCiAgICAgICAgbWVtYmVycyArPSByZS5maW5kYWxsKHInIi91c2VyX2luZm8vKFthLXpBLVowLTldKyknLCBwYWdlZGF0YSkKCiAgICByZXR1cm4gbWVtYmVycwoKZGVmIGdldF9wYWdlKHVybCk6CiAgICBwYWdlID0gb3BlbmVyLm9wZW4odXJsKQogICAgcGFnZWRhdGEgPSBwYWdlLnJlYWQoKQoKICAgICMgW3NoYW5nIHllXVs8YSBocmVmPSJuZXh0X3BhZ2VfdXJsIiBjbGFzcz0ibmV3cyI+eGlhIHllPC9hPl0KICAgIG5leHRfcGFnZSA9IHJlLnNlYXJjaCh1cidcdTAwQzlcdTAwQ0ZcdTAwRDJcdTAwQjMuK1xbPGEgaHJlZj0iKC4rKSIgY2xhc3M9Im5ld3MiPlx1MDBDRlx1MDBDMlx1MDBEMlx1MDBCMzwvYT5cXScsIHBhZ2VkYXRhKQogICAgcmV0dXJuIChuZXh0X3BhZ2UsIHBhZ2VkYXRhKQoKZGVmIHNvcnRfcG9zdF9ieV9jb3VudChwb3N0cyk6CiAgICBzb3J0ZWRfcG9zdF9ieV9jb3VudCA9IHNvcnRlZChwb3N0cy5pdGVyaXRlbXMoKSwga2V5ID0gb3BlcmF0b3IuaXRlbWdldHRlcigxKSkKICAgIHNvcnRlZF9wb3N0X2J5X2NvdW50LnJldmVyc2UoKQoKICAgIHJldHVybiBzb3J0ZWRfcG9zdF9ieV9jb3VudAoKCnVybCA9ICdodHRwOi8vdy4uLmNvbnRlbnQtYXZhaWxhYmxlLXRvLWF1dGhvci1vbmx5Li4ucy5jb20vbmV3aW5kZXgvbWl0YmJzX2Jic2xvZ2luLnBocCcKCmlmIGlkID09ICcnOgogICAgaWQgPSByYXdfaW5wdXQoJ1BsZWFzZSBlbnRlciB5b3VyIHVzZXIgaWQ6ICcpCmlmIHBhc3N3ZCA9PSAnJzoKICAgIHBhc3N3ZCA9IGdldHBhc3MuZ2V0cGFzcygpCgpkYXRhID0gWwogICAgKCdpZCcsICAgICAgICAgaWQpLAogICAgKCdwYXNzd2QnLCAgICAgcGFzc3dkKSwKICAgICgna2lja19tdWx0aScsICcxJyldICAgIyBjb25maXJtIGxvZ2luIHdpdGggbXVsdGlfc2Vzc2lvbi4KCmNqID0gY29va2llbGliLkNvb2tpZUphcigpCgpvcGVuZXIgPSB1cmxsaWIyLmJ1aWxkX29wZW5lcih1cmxsaWIyLkhUVFBDb29raWVQcm9jZXNzb3IoY2opKQoKcHJpbnQgJ0xvZ2dpbmcgaW4uLi4nCnJlc3BvbnNlID0gb3BlbmVyLm9wZW4odXJsLCB1cmxsaWIudXJsZW5jb2RlKGRpY3QoZGF0YSkpKQoKaG9tZV9wYWdlID0gcmVzcG9uc2UucmVhZCgpCgojIFRoZXJlJ3MgdHdvIHR5cGUgb2YgZXJyb3IgbWVzc2FnZSB0aGF0IG1pZ2h0IHJldHVybjoKIyBhbGVydCAoInlvbmcgaHUgbWluZyBjdW8gd3UsIGh1byB4aSB0b25nIGZhbiBtYW5nLCBxaW5nIGNob25nIHhpbiBkZW5nIGx1ISIpCiMgYWxlcnQoInlvbmcgaHUgbWkgbWEgY3VvIHd1LCBxaW5nIGNob25nIHhpbiBkZW5nIGx1ISIpCiMgTm90aWNlIHRoZSBleHRyYSBzcGFjZSBjaGFyYWN0ZXIgaW4gdGhlIGZpcnN0IGVycm9yIG1lc3NhZ2UuCiMgRDMgQzMgaXMgdGhlIGdiMjMxMiBjb2RlIGZvciAneW9uZycsIGFuZCBCQiBBNyBpcyBmb3IgJ2h1Jy4KaWYgcmUuc2VhcmNoKHVyJ2FsZXJ0XHMqXCgiXHUwMEQzXHUwMEMzXHUwMEJCXHUwMEE3JywgaG9tZV9wYWdlKToKICAgIHByaW50ICdGYWlsZWQgdG8gbG9naW4uIFBsZWFzZSB0cnkgYWdhaW4uJwogICAgZXhpdCgxKQoKCnByaW50ICdMb2dpbiBzdWNjZXNzZnVsbHkuJwoKcG9zdHMgPSB7fQoKIyB3ZW4gemhhbmcgbW8gc2hpIChmaXJzdCBwYWdlKQp1cmwgPSAnaHR0cDovL3cuLi5jb250ZW50LWF2YWlsYWJsZS10by1hdXRob3Itb25seS4uLnMuY29tL2NsdWJfYmJzZG9jMS9Ub3Bjb2RlcnNfMV8zLmh0bWwnCgp3aGlsZSBUcnVlOgogICAgKG5leHRfcGFnZSwgcGFnZWRhdGEpID0gZ2V0X3BhZ2UodXJsKQogICAgcHJpbnQgIlByb2Nlc3NpbmcgcGFnZSBbIiArIHVybCArICJdLi4uIgoKICAgICMgZ2V0IGFsbCB1c2VyIG5hbWVzLCB1c2VyIG5hbWUgY2FuIG9ubHkgY29udGFpbiBhbHBoYW51bWVyaWMgY2hhcmFjdGVycywgaWU6IFthLXpBLVowLTldCiAgICB1c2VycyA9IHJlLmZpbmRhbGwocidcJy91c2VyX2luZm8vKFthLXpBLVowLTldKyknLCBwYWdlZGF0YSkKICAgIGZvciB1c2VyIGluIHVzZXJzOgogICAgICAgIHBvc3RzW3VzZXJdID0gcG9zdHMuZ2V0KHVzZXIsIDApICsgMQoKICAgIGlmIG5vdCBuZXh0X3BhZ2U6CiAgICAgICAgYnJlYWs7CgogICAgbmV4dF9wYWdlX3VybCA9IG5leHRfcGFnZS5ncm91cCgxKQogICAgdXJsID0gJ2h0dHA6Ly93Li4uY29udGVudC1hdmFpbGFibGUtdG8tYXV0aG9yLW9ubHkuLi5zLmNvbScgKyBuZXh0X3BhZ2VfdXJsCgoKcHJpbnQgIiIKcHJpbnQgIk1lbWJlcnMgd2hvIG5ldmVyIHBvc3RlZCIKcHJpbnQgIi0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLSIKYWxsX3VzZXJzID0gZ2V0X21lbWJlcnNfbGlzdCgpCgpmb3IgdXNlciBpbiBhbGxfdXNlcnM6CiAgICBpZiBwb3N0cy5nZXQodXNlciwgMCkgPT0gMDoKICAgICAgICBwcmludCB1c2VyCgoKcHJpbnQgIiIKcHJpbnQgIk1lbWJlcnMgc29ydGVkIGJ5ICNwb3N0cyIKcHJpbnQgIi0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLSIKcG9zdHMgPSBzb3J0X3Bvc3RfYnlfY291bnQocG9zdHMpCgpmb3IgKHVzZXIsIG51bV9wb3N0cykgaW4gcG9zdHM6CiAgICBwcmludCAiJXM6ICVkIiAlICh1c2VyLCBudW1fcG9zdHMp

Not running #stdin #stdout 0s 0KB

stdin

copy

Standard input is empty

stdout

copy

Standard output is empty

https://ideone.com/M13Dv

language:

Python (cpython 2.7.16)

created:

visibility:

public

Share or Embed source code

Discover > Sphere Engine API

The brand new service which powers Ideone!

Discover > IDE Widget

Widget for compiling and running the source code in a web browser!

Discover > Sphere Engine API

Discover > IDE Widget

Choose your language