source: memlog_analyze @ c83befc

Revision c83befc, 10.9 KB checked in by Hal Finkel <hfinkel@…>, 9 years ago (diff)

make the output dir if it does not exist

  • Property mode set to 100755
RevLine 
[ebd57f8]1#! /usr/bin/env perl
2use strict;
3use File::Basename;
[c83befc]4use File::Path qw(make_path);
[c49b79c]5use Getopt::Long;
6
[9fcaba3]7my $find_leaks = 0;
[c49b79c]8my $print_raw_proc_name = 0;
9my $quiet = 0;
10my $help = 0;
11
12sub print_usage($) {
13  my $ec = $_[0];
14  my $usage = <<EOM;
[5df7203]15Usage: $0 [options] <memlog file or glob> [<output directory>]
[c49b79c]16  options:
[9fcaba3]17    --leaks
18      Provide information on leaks instead of peak usage
[c49b79c]19    --print-symbol-names
20      Include symbol names and offsets in the output
21    --quiet or -q
22      Don't print status messages while running
23EOM
24
25  print $usage;
26  exit($ec);
27}
28
[3533094]29GetOptions("help|h|?" => \$help,
[9fcaba3]30           "leaks" => \$find_leaks,
[c49b79c]31           "print-symbol-names" => \$print_raw_proc_name,
32           "quiet|q" => \$quiet)
33  or print_usage(1);
34
35if ($help) {
36  print_usage(0);
37}
[ebd57f8]38
[c83befc]39if (scalar(@ARGV) > 2) {
[d270799]40  print_usage(2);
41}
42
[81dea5b]43my $memlog_fn = $ARGV[0];
44my $out_dir = $ARGV[1] || '.';
45
[c83befc]46make_path($out_dir);
47
[81dea5b]48if (! -f $memlog_fn) {
[5df7203]49  my @pot_fns = glob($memlog_fn);
50  if (scalar(@pot_fns)) {
51    if (!$quiet) {
52      print "Searching all files matching '$memlog_fn'\n";
53    }
54
55    my $pot_max_rss = 0;
56    my $pos_max_rss_fn;
57    foreach my $pot_fn (@pot_fns) {
58      my $last_line = `tail -n 1 '$pot_fn'`;
59      chomp($last_line);
60
61      my @parts = split(/\t/, $last_line);
62
63      my $op = shift(@parts);
64      my $state = shift(@parts);
65
66      my ($time, $then_max_rss, $tid) = split(/\s+/, $state);
67      if ($pot_max_rss < $then_max_rss) {
68        $pot_max_rss = $then_max_rss;
69        $pos_max_rss_fn = $pot_fn;
70      }
71    }
72
73    if (defined $pos_max_rss_fn) {
74      $memlog_fn = $pos_max_rss_fn;
75      goto have_memlog_fn;
76    }
77  }
78
[c49b79c]79  print_usage(1);
[81dea5b]80}
[5df7203]81have_memlog_fn:
[81dea5b]82
[747d2b1]83# The version of addr2line and friends that you use can make a big difference,
84# especially on BE ppc64, where older versions of addr2line did not account
85# correctly for the function descriptor setup. At ALCF, on the BG/Q, we have
86# newer versions not in the default search path (from bgclang).
87my $alcf_bu_dir = '/soft/compilers/bgclang/current/binutils/bin';
88if (-d $alcf_bu_dir) {
89  $ENV{'PATH'} = $alcf_bu_dir . ':' . $ENV{'PATH'};
90}
91
[81dea5b]92open(MEMLOG, $memlog_fn) || die "Can't open $memlog_fn: $!";
93
[0edbc98]94# The first step is to determine the high-water mark.
95my $max_rss = 0;
96foreach my $line (<MEMLOG>) {
97  chomp($line);
98  my @parts = split(/\t/, $line);
99
100  my $op = shift(@parts);
101  my $state = shift(@parts);
102
103  my ($time, $then_max_rss, $tid) = split(/\s+/, $state);
104  if ($max_rss < $then_max_rss) {
105    $max_rss = $then_max_rss;
106  }
107}
108
109seek(MEMLOG, 0, 0);
110
111# Scan the log for malloc/free pairings. We're interested only in active
112# allocations at the time when the rss reaches the final maxrss.
[9fcaba3]113# If we're finding leaks, then go to the very end.
114my $active_alloc_time = 0;
[0edbc98]115my %malloc_lines;
116foreach my $line (<MEMLOG>) {
117  chomp($line);
118  my @parts = split(/\t/, $line);
119
120  my $op = shift(@parts);
121  my $state = shift(@parts);
122
123  if ($op =~ /^M:/) {
124    my ($size, $ptr) = ($op =~ /^M: (\d+) 0x(\w+)/);
125    $malloc_lines{$ptr} = $line;
126  } elsif ($op =~ /^F:/) {
127    my ($ptr) = ($op =~ /^F: 0x(\w+)/);
128    delete $malloc_lines{$ptr};
129  } else {
130    next;
131  }
132
133  my ($time, $then_max_rss, $tid) = split(/\s+/, $state);
[9fcaba3]134  $active_alloc_time = $time;
135
136  if (!$find_leaks) {
137    # If we've reached the max rss, we've seen all we need to see.
138    if ($then_max_rss == $max_rss) {
139      last;
140    }
[0edbc98]141  }
142}
143
144close(MEMLOG);
145
146# Convert maxrss, currently in KB, to bytes.
147$max_rss *= 1024;
148
[ebd57f8]149my $total_size = 0;
150my %roots;
[c4f89cf]151my %all_nodes;
[0edbc98]152foreach my $line (values %malloc_lines) {
[ebd57f8]153  my @parts = split(/\t/, $line);
154
155  my $op = shift(@parts);
156  my $state = shift(@parts);
157
158  # Only dealing with allocations here...
159  if ($op !~ /^M:/) {
160    next;
161  }
162
163  my ($size, $ptr) = ($op =~ /^M: (\d+) 0x(\w+)/);
[0edbc98]164  my ($time, $then_max_rss, $tid) = split(/\s+/, $state);
[ebd57f8]165
166  $total_size += $size;
167
168  sub level_parts($) {
169    my $level = @_[0];
170    my ($file_name, $proc_name, $off, $pc, $relpc) =
171      ($level =~ /^(.*) \((.*)\+0x(\w+)\) \[0x(\w+) \(0x(\w+)\)\]/);
172
173    return ($file_name, $proc_name, $off, $pc, $relpc);
174  }
175
176  # Put the top of the stack first.
177  @parts = reverse(@parts);
178
179  my $parent = \%roots;
180  for (my $i = 0; $i < scalar(@parts); ++$i) {
181    my $level = $parts[$i];
182    my ($file_name, $proc_name, $off, $pc, $relpc) = level_parts($level);
183
184    # Skip this level if we don't even know from what file it came.
185    if ($file_name eq '?') {
186      next;
187    }
188
189    # print STDERR "parsed: $file_name, $proc_name, $off, $pc, $relpc\n";
190
[c4f89cf]191    if (!exists $all_nodes{$pc}) {
192      $all_nodes{$pc}->{'file_name'} = $file_name;
193      $all_nodes{$pc}->{'proc_name'} = $proc_name;
194      $all_nodes{$pc}->{'off'} = $off;
195      $all_nodes{$pc}->{'pc'} = $pc;
196      $all_nodes{$pc}->{'relpc'} = $relpc;
197    }
[ebd57f8]198
[c4f89cf]199    if (!exists $parent->{$pc}) {
200      $parent->{$pc} = $all_nodes{$pc};
[ebd57f8]201    }
202
203    $parent->{$pc}->{'size'} += $size;
204
205    my ($next_file_name, $next_proc_name, $next_off, $next_pc, $next_relpc);
206    if ($i < scalar(@parts)-1) {
207     my $next_level = $parts[$i+1];
208     ($next_file_name, $next_proc_name, $next_off, $next_pc, $next_relpc) =
209       level_parts($next_level);
210      $parent->{$pc}->{'child_sizes'}->{$next_pc} += $size;
211    }
212
213    if (!exists $parent->{'children'}) {
214      $parent->{'children'} = {};
215    }
216
217    $parent = $parent->{'children'};
218  }
219}
220
[20b45de]221my $txt_fn = "$out_dir/" . basename($memlog_fn) . ".txt";
[81dea5b]222my $dot_fn = "$out_dir/" . basename($memlog_fn) . ".dot";
223my $ps_fn = "$out_dir/" . basename($memlog_fn) . ".ps";
224my $pdf_fn = "$out_dir/" . basename($memlog_fn) . ".pdf";
225
[c49b79c]226if (!$quiet) {
227  print "Creating $txt_fn\n";
228}
229
[20b45de]230open(TXT, ">$txt_fn") || die "Can't open $txt_fn: $!";
[c49b79c]231
232if (!$quiet) {
233  print "Creating $dot_fn\n";
234}
235
[81dea5b]236open(DOT, ">$dot_fn") || die "Can't open $dot_fn: $!";
237
[ebd57f8]238sub format_bytes($) {
239  my @sizes = qw( B KB MB GB TB PB );
240  my $size = $_[0];
241
242  my $i = 0;
243  while ($size > 1024) {
244    $size /= 1024;
245    ++$i;
246  }
247
[4bd7a88]248  return sprintf("%.3f $sizes[$i]", $size);
[ebd57f8]249}
250
[bdaf020]251print DOT ("digraph \"memlog\" {\n");
[81dea5b]252print DOT ("size=\"8,11\";\n");
253print DOT ("node [width=0.375,height=0.25];\n");
[ebd57f8]254
[9fcaba3]255my $find_type = $find_leaks ? " (leaks)" : "";
[bdaf020]256printf DOT ("Legend [shape=box, fontsize=100, shape=oval," .
[9fcaba3]257            "label=\"Total: %s active$find_type at maxrss = %s after %s s\"];\n",
258            format_bytes($total_size), format_bytes($max_rss),
259            $active_alloc_time);
[bdaf020]260
[9fcaba3]261printf TXT ("memlog: Total: %s active$find_type at maxrss = %s after %s s\n\n",
262            format_bytes($total_size), format_bytes($max_rss),
263            $active_alloc_time);
[20b45de]264
[ebd57f8]265my %cached_names;
266sub get_name($) {
267  my $node = $_[0];
268  my $pc = $node->{'pc'};
269
270  if (exists $cached_names{$pc}) {
271    return $cached_names{$pc};
272  }
273
274  my $ret = '';
275
276  # Prefer the relative offset (that is what we want for shared libraries), but
277  # if is not available, use the full offset (which is what we want for the
278  # base executable).
279  my $exe_off = $node->{'relpc'};
280  if (!$exe_off) {
281    $exe_off = $pc;
282  }
283
284  my $file_name = $node->{'file_name'};
[518793d]285
286  # If we don't have an absolute path, this is probably the base dynamic
287  # executable, so ask the shell which one it used (not foolproof because we
288  # might not have the same PATH now, but hopefully is generally the right
289  # thing).
290  if ($file_name !~ /^\//) {
291    $file_name = `which '$file_name'`;
292    chomp($file_name);
293  }
294
295  my ($func, $loc) = `addr2line -e '$file_name' -f 0x$exe_off`;
[ebd57f8]296  chomp($func);
297  chomp($loc);
298
299  if ($func !~ /^\?/) {
[6520ef5]300    # In general, this function name might look something like:
301    #   00000329.plt_call.wcsnrtombs@@GLIBC_2.3+0
[10599da]302    $func =~ s/@.*//; # Remove trailing symbol version strings
[ebd57f8]303    $func =~ s/.*\.//;
304    $func = `c++filt '$func'`;
305    chomp($func);
306
[1bd82e0]307    # It sometimes happens that addr2line is a bit too smart: when debugging
308    # information is available, it might print a local alias for the
309    # function instead of the full name (for example, printing 'List'
310    # instead of 'Foo::List<int>::List(int, int const&)').
311    if ($node->{'proc_name'} ne '?') {
312      my $proc_name = $node->{'proc_name'};
313      $proc_name = `c++filt '$proc_name'`;
314      chomp($proc_name);
315
316      if (length($proc_name) > length($func)) {
317        $func = $proc_name;
318      }
319    }
320
[081a0fa]321    $ret .= $func . '\n';
322
[77ebdb8]323    if ($loc !~ /^[:?]/) {
[081a0fa]324      $ret .= $loc . '\n';
325    }
[4bd7a88]326  } elsif ($node->{'proc_name'} ne '?') {
327    my $proc_name = $node->{'proc_name'};
328    $proc_name = `c++filt '$proc_name'`;
329    chomp($proc_name);
330
331    $ret .= $proc_name . '\n';
[ebd57f8]332  }
333
[6bfe6a1]334  $ret .= $node->{'file_name'};
335  if ($print_raw_proc_name and $node->{'proc_name'} ne '?') {
336    $ret .= '\n' . $node->{'proc_name'} . '+0x' . $node->{'off'};
[ebd57f8]337  }
338
339  $cached_names{$pc} = $ret;
340  return $ret;
341}
342
[4bd7a88]343my $skip_frac = 0.01;
344my %skipped;
345
[c4f89cf]346foreach my $pc (keys %all_nodes) {
347  my $node = $all_nodes{$pc};
[ebd57f8]348
349  my $local_size = $node->{'size'};
[4bd7a88]350  if ($local_size * 1.0 / $total_size < $skip_frac) {
[c4f89cf]351    $skipped{$pc} = 1;
[4bd7a88]352    next;
353  }
[ebd57f8]354
355  my $fs = 8.0;
356  if ($local_size > 0) {
[4bd7a88]357    $fs = 50.0 * (abs($local_size * 1.0 / $total_size))**0.125;
[ebd57f8]358  }
359
[20b45de]360  my $name = get_name($node);
361
[81dea5b]362  printf DOT ("N%s [label=\"%s\\n%s\", shape=box, fontsize=%.1f%s];\n",
[c4f89cf]363    $pc, $name, format_bytes($local_size), $fs);
[ebd57f8]364}
365
[c4f89cf]366foreach my $pc (keys %all_nodes) {
367  if ($skipped{$pc}) {
[4bd7a88]368    next;
369  }
[ebd57f8]370
[20b45de]371  my $node = $all_nodes{$pc};
372  my $local_size = $node->{'size'};
373
[ebd57f8]374  foreach my $cpc (keys %{$node->{'child_sizes'}}) {
[4bd7a88]375    if ($skipped{$cpc}) {
376      next;
377    }
378
[ebd57f8]379    my $child_size = $node->{'child_sizes'}->{$cpc};
380    my $frac = $child_size * 1.0 / $local_size;
381
[4bd7a88]382    my $weight = 100.0 * sqrt($frac);
[6520ef5]383    my $style = sprintf("setlinewidth(%f)", 8.0 * sqrt($frac));
[ebd57f8]384
[6520ef5]385    my $fs = 40.0 * $frac**0.125;
386
[81dea5b]387    printf DOT ("N%s -> N%s [label=\"%s\", weight=%d, style=\"%s\", fontsize=%.1f];\n",
[6520ef5]388      $pc, $cpc, format_bytes($child_size), $weight, $style, $fs);
[ebd57f8]389  }
390}
391
[81dea5b]392print DOT ("}\n");
393
[20b45de]394foreach my $pc (sort { $all_nodes{$::b}->{'size'} <=>
395                       $all_nodes{$::a}->{'size'} } keys %all_nodes) {
396  if ($skipped{$pc}) {
397    next;
398  }
399
400  print TXT ('*' x 80) . "\n\n";
401
402  my $node = $all_nodes{$pc};
403
404  my $local_size = $node->{'size'};
405  printf TXT ("%s - %.1f%%\n", format_bytes($local_size),
406              $local_size * 100.0 / $total_size);
407
408  my $name = get_name($node);
409  $name =~ s/\\n/\n/g;
410
411  print TXT "$name\n$pc\n";
412
413  print TXT "\nMEMORY ALLOCATED BY CALLEES:\n";
414
415  foreach my $cpc (sort { $node->{'child_sizes'}->{$::b} <=>
416                          $node->{'child_sizes'}->{$::a} }
417                     keys %{$node->{'child_sizes'}}) {
418    if ($skipped{$cpc}) {
419      next;
420    }
421
422    my $child_node = $all_nodes{$cpc};
423    my $child_size = $node->{'child_sizes'}->{$cpc};
424
425    printf TXT ("\t%s - %.1f%%\n", format_bytes($child_size),
426                $child_size * 100.0 / $local_size);
427
428    my $child_name = get_name($child_node);
429    $child_name =~ s/\\n/\n\t/g;
430    print TXT "\t$child_name\n\t$cpc\n";
431
432    print TXT "\n";
433  }
434
435  print TXT "\n";
436}
437
438close(TXT);
[81dea5b]439close(DOT);
440
[c49b79c]441if (!$quiet) {
442  print "Creating $ps_fn\n";
443}
444
[81dea5b]445system("dot -Tps2 < '$dot_fn' > '$ps_fn'");
[c49b79c]446
447if (!$quiet) {
448  print "Creating $pdf_fn\n";
449}
450
[81dea5b]451system("ps2pdf '$ps_fn' '$pdf_fn'");
452
453exit 0;
[ebd57f8]454
Note: See TracBrowser for help on using the repository browser.